Il Playground
Il Playground è un ambiente di test dove puoi sperimentare diverse configurazioni prima di applicarle all'azienda. È come un laboratorio dove testare le impostazioni senza impattare l'ambiente di produzione.
Accesso limitato
Il Playground è disponibile solo per utenti con ruolo Admin o superiore. Se non vedi questa opzione nel menu, contatta l'amministratore.
Quando usare il Playground
Il Playground è utile quando vuoi:
- Testare un nuovo preset prima di renderlo attivo
- Ottimizzare le risposte per un tipo specifico di documenti
- Confrontare configurazioni diverse per capire quale funziona meglio
- Debug: capire perché le risposte non sono soddisfacenti
Come funziona
Il Playground ha due aree principali:
1. Pannello di configurazione (sinistra)
Qui imposti tutti i parametri della ricerca AI:
Selezione Azienda
- Scegli l'azienda su cui testare
- Ogni azienda ha i propri documenti e impostazioni
Selezione Topic
- Opzionale: limita la ricerca a un topic specifico
Preset
- Scegli un preset esistente come base
- Vedi se ci sono personalizzazioni "(mod)" attive
Provider AI
- Ollama: Modello locale di default (Qwen 2.5 32B)
- Ollama Cloud: Per test con server remoto
- Groq: Provider cloud gratuito
- Custom: Usa il provider configurato dall'azienda (OpenAI/Anthropic/Google)
Provider Custom
Se la tua azienda ha configurato un provider custom (es. OpenAI), puoi testarlo selezionando "Custom" nel dropdown Provider.
Parametri del Modello AI
- Temperature (0.0-1.0): controlla la "creatività"
- Max Tokens: lunghezza massima della risposta
Toggle Sorgenti Dati
- Usa Knowledge Base: Include la knowledge base aziendale nella ricerca
- Usa Documenti: Include i documenti utente nella ricerca
Puoi disabilitare una o entrambe le sorgenti per testare comportamenti specifici.
Parametri di Ricerca
Adaptive Retrieval (v2.4.0)
A partire dalla v2.4.0, i parametri Top K, Score Threshold e altri vengono ottimizzati automaticamente in base alla complessità della query.
- Query semplici → topK basso (10), threshold alto (0.7)
- Query complesse → topK medio (50), threshold moderato (0.5)
- Query aggregative (liste, conteggi) → topK alto (200), threshold basso (0.4)
Nel pannello Retrieval vedrai il banner "Adaptive Retrieval attivo". Per override manuali, attiva la modalità Advanced (⚡).
- Max Sources to Show: quante fonti mostrare nella risposta (sempre visibile)
- Top K, Score Threshold, etc.: visibili solo in modalità Advanced per override manuali
System Prompt
- Il prompt base che istruisce l'AI
- Ogni topic può sovrascrivere questo prompt
2. Area Chat (destra)
Qui fai le domande di test:
- Scrivi una domanda nel campo in basso
- Premi Invio per inviare
- La risposta mostra:
- Il testo generato dall'AI
- Le fonti utilizzate con percentuale di rilevanza
- Tempo di risposta e token utilizzati
Workflow consigliato
1. Identifica il problema
Prima di entrare nel Playground, chiarisci cosa vuoi migliorare:
- "Le risposte sono troppo lunghe"
- "L'AI non trova documenti rilevanti"
- "Il tono non è appropriato"
2. Scegli la configurazione base
- Seleziona l'azienda
- Se necessario, seleziona un topic
- Applica il preset più vicino al tuo caso d'uso
3. Testa con domande reali
Usa domande che i tuoi utenti farebbero realmente:
- "Qual è la procedura per..."
- "Quanto costa..."
- "Chi è responsabile di..."
4. Analizza le risposte
Per ogni risposta, verifica:
- Accuratezza: la risposta è corretta?
- Fonti: i documenti citati sono pertinenti?
- Tono: il linguaggio è appropriato?
- Completezza: manca qualcosa di importante?
5. Regola i parametri
In base all'analisi, prova a modificare:
| Problema | Possibile soluzione |
|---|---|
| Risposte troppo creative | Abbassa Temperature |
| Non trova documenti | Attiva Advanced mode e abbassa Score Threshold |
| Risposte troppo corte | Aumenta Max Tokens |
| Manca contesto | Attiva Advanced mode e aumenta Top K |
| Tono sbagliato | Modifica System Prompt |
Adaptive Retrieval
Nella maggior parte dei casi, il sistema ottimizza automaticamente i parametri. Attiva la modalità Advanced (⚡) solo se hai bisogno di controllo manuale.
6. Salva la configurazione
Quando sei soddisfatto:
- Clicca Salva in Azienda per applicare all'azienda selezionata
- Oppure Salva come Preset per creare un template riutilizzabile
Capire le metriche
Tempo di risposta
Visualizzato in millisecondi (ms). Un tempo normale è:
- < 2000ms: veloce
- 2000-5000ms: nella norma
5000ms: lento (potrebbe indicare troppi documenti o modello sovraccarico)
Token utilizzati
I token sono le "unità" di testo elaborate. Più token = risposta più lunga e più costo computazionale.
Score delle fonti
Ogni fonte ha una percentuale di rilevanza:
- 80-100%: molto pertinente
- 60-80%: pertinente
- 40-60%: parzialmente pertinente
- < 40%: potrebbe essere rumore
Confrontare configurazioni
Per confrontare due configurazioni:
- Testa la configurazione A con una serie di domande
- Annota i risultati (tempo, accuratezza, fonti)
- Modifica i parametri (configurazione B)
- Ripeti le stesse domande
- Confronta i risultati
Suggerimento
Usa sempre le stesse domande per confrontare configurazioni diverse. Questo ti permette un confronto oggettivo.
Reset delle modifiche
Se hai fatto modifiche che non vuoi mantenere:
Reset Preset: clicca l'icona di refresh accanto al preset per tornare alla configurazione originale (rimuove le modifiche "(mod)")
Reset Completo: ricarica la pagina per azzerare tutte le modifiche non salvate
Salvare le configurazioni
Salva in Azienda
Applica la configurazione corrente all'azienda selezionata:
- Tutti gli utenti dell'azienda useranno queste impostazioni
- Il sistema prompt viene salvato
- Se usi un preset, viene creata una versione "(mod)" personalizzata
Salva come Preset (solo Admin di Sistema)
Crea un nuovo preset riutilizzabile:
- Inserisci nome e descrizione
- Il preset sarà disponibile per tutte le aziende
- Utile per creare template settoriali
RAG Features (v2.4.0)
Il pannello RAG Features controlla le funzionalità intelligenti del sistema:
Orchestrazione Intelligente
| Feature | Descrizione | Default |
|---|---|---|
| Query Decomposition | Scompone query complesse in sub-query | ✓ On |
| Adaptive Retrieval | Ottimizza automaticamente topK, threshold | ✓ On |
| Query Rewriting | LLM riscrive la query per migliorare il retrieval | ✓ On |
| CRAG | Verifica e corregge le risposte iterativamente | ✓ On |
| Aggregative Detection | Riconosce query di lista/conteggio | ✓ On |
Query Decomposition
Quando attivo, il sistema analizza la query e decide la strategia:
- sequential: "Chi sono gli eredi e che quote hanno?" → prima trova eredi, poi le quote
- parallel: "Confronta contratto A con B" → cerca entrambi in parallelo
- hierarchical: Query esplorative → da generale a specifico
- comparative: "Differenze tra X e Y" → confronto side-by-side
Adaptive Retrieval
Quando attivo, i parametri vengono calcolati automaticamente:
| Tipo Query | topK | Threshold | Reranking |
|---|---|---|---|
| Semplice | 10 | 0.7 | ✓ |
| Moderata | 30 | 0.6 | ✓ |
| Complessa | 50 | 0.5 | ✓ |
| Aggregativa | 200 | 0.4 | ✗ |
Disabilitare con cautela
Disabilitare Query Decomposition o Adaptive Retrieval può peggiorare i risultati per query complesse. Fallo solo per debug o test specifici.
Suggerimenti per l'ottimizzazione
I preset esistenti sono già ottimizzati per ogni settore. Ecco i valori principali di riferimento:
Per documenti legali (preset LEGAL)
Temperature: 0.0 (zero creatività)
Top K: 25
Reranker Threshold: 0.18 (alta rilevanza)
Abstain: abilitato (rifiuta se incerto)Per FAQ e supporto clienti (preset SUPPORT)
Temperature: 0.1 (leggermente naturale)
Top K: 15 (risposte veloci)
Reranker Threshold: 0.08 (flessibile)
Semantic Cache: abilitataPer ricerca accademica (preset RESEARCH)
Temperature: 0.0 (preciso)
Top K: 40 (copertura ampia)
MMR: abilitato (diversifica fonti)
Context: 10000 tokensPer HR e analisi CV (preset HR)
Temperature: 0.0
Top K: 35 (confronta candidati)
MMR: abilitato (diversifica profili)
Min Sources: 10TIP
Per vedere tutti i parametri disponibili, consulta il Riferimento Parametri RAG.