Riferimento Parametri RAG
Questa guida descrive in dettaglio tutti i parametri configurabili nel sistema RAG. Ogni parametro influenza il comportamento dell'AI in modo specifico.
Solo per utenti avanzati
Questa pagina è pensata per amministratori che vogliono creare o modificare preset personalizzati. Per un uso normale, i preset predefiniti sono già ottimizzati.
Panoramica Preset Esistenti
Queria include 8 preset ottimizzati con parametri v1.4.0:
| Preset | Settore | topK | Temperature | Abstain | Cache | MMR |
|---|---|---|---|---|---|---|
| LEGAL (Default) | Legale | 25 | 0.0 | Si | No | No |
| HEALTHCARE | Sanità | 25 | 0.0 | Si | No | No |
| FINANCE | Finanza | 20 | 0.0 | Si | No | No |
| HR | Risorse Umane | 35 | 0.0 | No | No | Si |
| RESEARCH | Ricerca | 40 | 0.0 | No | No | Si |
| SUPPORT | Supporto | 15 | 0.1 | No | Si | No |
| ECOMMERCE | E-Commerce | 20 | 0.0 | No | Si | No |
| EDUCATION | Istruzione | 22 | 0.1 | No | Si | Si |
Parametri del Modello (LLM)
Questi parametri controllano come il modello AI genera le risposte.
Temperature
| Parametro | Range | Impatto |
|---|---|---|
llm.temperature | 0.0 - 1.0 | Creatività/determinismo |
Cosa fa: Controlla quanto l'AI è "creativa" vs "deterministica".
| Valore | Comportamento | Usato da |
|---|---|---|
| 0.0 | Massima precisione, risposte fattuali | LEGAL, HEALTHCARE, FINANCE, HR, RESEARCH, ECOMMERCE |
| 0.1 | Leggermente più naturale, buono per interazioni | SUPPORT, EDUCATION |
Consiglio
Per RAG documentale, la temperature è quasi sempre 0.0. Valori più alti aumentano il rischio di "allucinazioni".
Max Tokens
| Parametro | Range | Impatto |
|---|---|---|
llm.maxTokens | 256 - 8192 | Lunghezza massima risposta |
Valori per preset:
| Preset | maxTokens | Uso |
|---|---|---|
| SUPPORT, ECOMMERCE | 1500 | Risposte brevi e concise |
| FINANCE, LEGAL, HEALTHCARE | 2000-2500 | Risposte medie |
| HR, EDUCATION | 2500-3000 | Analisi dettagliate |
| RESEARCH | 3500 | Analisi approfondite |
Top P (Nucleus Sampling)
| Parametro | Range | Impatto |
|---|---|---|
llm.topP | 0.0 - 1.0 | Diversità lessicale |
Valori per preset:
- 0.88: HEALTHCARE (molto focalizzato)
- 0.90: LEGAL (focalizzato)
- 0.92: FINANCE, RESEARCH (bilanciato)
- 0.95: HR, SUPPORT, EDUCATION, ECOMMERCE (più naturale)
Parametri di Ricerca (Retrieval)
Questi parametri controllano come vengono recuperati i documenti rilevanti.
Top K
| Parametro | Range | Impatto |
|---|---|---|
retrieval.topK | 5 - 100 | Numero documenti candidati |
Cosa fa: Quanti "chunk" di documento vengono recuperati inizialmente dalla ricerca semantica.
| Preset | topK | Motivazione |
|---|---|---|
| SUPPORT | 15 | Velocità |
| FINANCE | 20 | Precisione |
| ECOMMERCE | 20 | Velocità |
| EDUCATION | 22 | Bilanciato |
| LEGAL | 25 | Precisione |
| HEALTHCARE | 25 | Precisione |
| HR | 35 | Confronto candidati |
| RESEARCH | 40 | Copertura ampia |
BM25 Top K
| Parametro | Range | Impatto |
|---|---|---|
retrieval.bm25TopK | 5 - 50 | Risultati ricerca keyword |
Cosa fa: Quanti risultati dalla ricerca per parole chiave (BM25) vengono considerati.
| Preset | bm25TopK | Note |
|---|---|---|
| SUPPORT | 15 | Veloce |
| LEGAL, EDUCATION | 20 | Bilanciato |
| HEALTHCARE, FINANCE | 22 | Termini precisi |
| ECOMMERCE | 28 | SKU/codici prodotto |
| HR | 30 | Skills/keywords |
| RESEARCH | 35 | Copertura ampia |
RRF Constant
| Parametro | Range | Impatto |
|---|---|---|
retrieval.rrfConstant | 20 - 100 | Bilanciamento fusione risultati |
Cosa fa: Parametro per la fusione dei risultati (Reciprocal Rank Fusion). Valori più alti danno più peso ai risultati in posizioni più basse.
| Valore | Preset | Effetto |
|---|---|---|
| 50 | SUPPORT | Privilegia top results |
| 55 | HR, ECOMMERCE | Bilanciato |
| 60 | FINANCE, EDUCATION | Bilanciato |
| 65 | RESEARCH | Include più risultati |
| 70 | LEGAL, HEALTHCARE | Più bilanciato |
Merged Top K
| Parametro | Range | Impatto |
|---|---|---|
retrieval.mergedTopK | 5 - 50 | Risultati finali dopo fusione |
Cosa fa: Quanti risultati vengono mantenuti dopo aver fuso ricerca semantica e BM25.
Range nei preset: 12 (SUPPORT) - 32 (RESEARCH)
Max Sources to Show
| Parametro | Range | Impatto |
|---|---|---|
retrieval.maxSourcesToShow | 3 - 15 | Fonti visibili all'utente |
| Preset | Valore | Motivazione |
|---|---|---|
| SUPPORT | 3 | Risposte concise |
| LEGAL, HEALTHCARE, ECOMMERCE | 5 | Qualità |
| FINANCE, EDUCATION | 6 | Dettaglio |
| RESEARCH | 8 | Riferimenti multipli |
| HR | 10 | Confronto candidati |
Soglie di Rilevanza
Questi parametri definiscono quando un documento è "abbastanza rilevante".
Specific Threshold
| Parametro | Range | Impatto |
|---|---|---|
relevance.specificThreshold | 0.01 - 0.5 | Soglia query specifiche |
Cosa fa: Soglia minima di similarità per query specifiche (es. "Qual è la data del contratto ACME?").
| Precisione | Valore | Preset |
|---|---|---|
| Tollerante | 0.05 | SUPPORT |
| Tollerante | 0.06 | HR |
| Moderata | 0.07 | ECOMMERCE |
| Moderata | 0.08 | RESEARCH, EDUCATION |
| Alta | 0.11 | FINANCE |
| Massima | 0.14 | LEGAL |
| Critica | 0.16 | HEALTHCARE |
Aggregative Threshold
| Parametro | Range | Impatto |
|---|---|---|
relevance.aggregativeThreshold | 0.01 - 0.3 | Soglia query aggregate |
Cosa fa: Soglia per query che richiedono aggregazione (es. "Elenca tutti i fornitori").
Soglia più bassa perché deve catturare più risultati:
- 0.03: HR, SUPPORT
- 0.04: ECOMMERCE, RESEARCH, EDUCATION
- 0.06: FINANCE
- 0.08: LEGAL
- 0.10: HEALTHCARE
Generic Threshold
| Parametro | Range | Impatto |
|---|---|---|
relevance.genericThreshold | 0.01 - 0.3 | Soglia query generiche |
Range nei preset: 0.04 (SUPPORT, HR) - 0.12 (HEALTHCARE)
BM25 Boost Weight
| Parametro | Range | Impatto |
|---|---|---|
relevance.bm25BoostWeight | 0.0 - 1.0 | Peso ricerca keyword |
Cosa fa: Quanto la corrispondenza esatta delle parole chiave aumenta lo score.
| Valore | Preset | Uso |
|---|---|---|
| 0.25 | LEGAL, HEALTHCARE, RESEARCH | Semantica prioritaria |
| 0.30 | EDUCATION | Bilanciato |
| 0.32 | FINANCE | Numeri precisi |
| 0.35 | HR, SUPPORT | Keywords importanti |
| 0.42 | ECOMMERCE | Forte - SKU/codici |
Freshness Boost
| Parametro | Range | Impatto |
|---|---|---|
relevance.freshnessBoost | 0.0 - 0.5 | Boost documenti recenti |
| Valore | Preset | Motivazione |
|---|---|---|
| 0.05 | LEGAL, SUPPORT | Contenuti stabili |
| 0.08 | EDUCATION | Contenuti didattici stabili |
| 0.10 | ECOMMERCE | Moderato |
| 0.12 | HEALTHCARE | Linee guida si aggiornano |
| 0.15 | HR | CV recenti preferiti |
| 0.20 | FINANCE | Dati fiscali recenti |
| 0.25 | RESEARCH | Paper recenti importanti |
Configurazione Reranker
Il reranker è un secondo passaggio che riordina i risultati per maggiore precisione.
Enabled
| Parametro | Valori | Impatto |
|---|---|---|
reranker.enabled | true/false | Attiva/disattiva reranking |
Tutti i preset hanno il reranker abilitato per massimizzare la qualità.
Reranker Top K
| Parametro | Range | Impatto |
|---|---|---|
reranker.topK | 5 - 30 | Risultati dopo reranking |
| Preset | topK | Note |
|---|---|---|
| SUPPORT | 6 | Veloce |
| LEGAL, HEALTHCARE, ECOMMERCE | 8 | Qualità |
| FINANCE, EDUCATION | 10 | Bilanciato |
| RESEARCH | 14 | Ampio |
| HR | 15 | Confronto |
Score Threshold
| Parametro | Range | Impatto |
|---|---|---|
reranker.scoreThreshold | 0.0 - 1.0 | Soglia minima reranking |
| Precisione | Valore | Preset |
|---|---|---|
| Tollerante | 0.08 | HR, SUPPORT |
| Moderata | 0.10 | RESEARCH, EDUCATION, ECOMMERCE |
| Alta | 0.14 | FINANCE |
| Massima | 0.18 | LEGAL |
| Critica | 0.20 | HEALTHCARE |
Min Results
| Parametro | Range | Impatto |
|---|---|---|
reranker.minResults | 1 - 10 | Risultati minimi garantiti |
| Preset | Valore | Note |
|---|---|---|
| HEALTHCARE | 2 | Solo se rilevanti |
| LEGAL, SUPPORT | 3 | Qualità |
| FINANCE, ECOMMERCE | 4 | Bilanciato |
| EDUCATION | 5 | Didattico |
| RESEARCH | 6 | Comprensivo |
| HR | 8 | Confronto candidati |
Bilanciamento Dual RAG
Questi parametri controllano come vengono bilanciate le due sorgenti dati: Knowledge Base e Documenti Utente.
Document Weight
| Parametro | Range | Impatto |
|---|---|---|
sourceBalance.documentWeight | 0.0 - 1.0 | Peso documenti utente |
| Preset | docWeight | kbWeight | Priorità |
|---|---|---|---|
| SUPPORT | 0.30 | 0.70 | Knowledge (FAQ) |
| LEGAL | 0.40 | 0.60 | Knowledge (normative) |
| HEALTHCARE | 0.45 | 0.55 | Knowledge (protocolli) |
| RESEARCH, EDUCATION | 0.55 | 0.45 | Bilanciato |
| FINANCE | 0.65 | 0.35 | Documenti |
| ECOMMERCE | 0.80 | 0.20 | Documenti (prodotti) |
| HR | 0.85 | 0.15 | Documenti (CV) |
Min Documents / Min Knowledge
| Parametro | Range | Impatto |
|---|---|---|
sourceBalance.minDocuments | 0 - 10 | Minimo da documenti |
sourceBalance.minKnowledge | 0 - 10 | Minimo da knowledge |
| Preset | minDocs | minKB | Note |
|---|---|---|---|
| SUPPORT | 0 | 2 | Focus su FAQ |
| ECOMMERCE | 2 | 0 | Focus su prodotti |
| HR | 3 | 0 | Confronto candidati |
| LEGAL, HEALTHCARE | 1 | 3 | Sempre riferimenti normativi |
| FINANCE | 2 | 1 | Bilanciato |
| RESEARCH, EDUCATION | 2 | 2 | Bilanciato |
Parametri Avanzati (v1.4.0)
MMR (Maximal Marginal Relevance)
Evita risultati troppo simili tra loro.
| Parametro | Range | Impatto |
|---|---|---|
mmr.enabled | true/false | Attiva diversificazione |
mmr.lambda | 0.0 - 1.0 | Bilanciamento rilevanza/diversità |
| Preset | Enabled | Lambda | Motivazione |
|---|---|---|---|
| HR | Si | 0.60 | Diversificare candidati |
| RESEARCH | Si | 0.60 | Diversificare fonti |
| EDUCATION | Si | 0.65 | Diversificare contenuti |
| LEGAL, HEALTHCARE, FINANCE, SUPPORT, ECOMMERCE | No | - | Precisione prioritaria |
Lambda:
- 0.5-0.6: Massima diversità
- 0.65-0.7: Bilanciato
- 1.0: Solo rilevanza
Recency Boost
Favorisce documenti più recenti.
| Parametro | Range | Impatto |
|---|---|---|
recency.enabled | true/false | Attiva boost temporale |
recency.halfLifeDays | 30 - 365 | Giorni per dimezzare il boost |
recency.maxBoost | 0.0 - 0.5 | Boost massimo per doc nuovi |
| Preset | Enabled | halfLife | maxBoost |
|---|---|---|---|
| HR | Si | 180 | 0.15 |
| FINANCE | Si | 365 | 0.20 |
| HEALTHCARE | Si | 365 | 0.15 |
| LEGAL | Si | 365 | 0.10 |
| RESEARCH | Si | 365 | 0.25 |
| SUPPORT, ECOMMERCE, EDUCATION | No | - | - |
Context Window
Gestione del contesto inviato al modello.
| Parametro | Range | Impatto |
|---|---|---|
context.maxTokens | 2000 - 16000 | Token massimi di contesto |
| Preset | maxTokens | Note |
|---|---|---|
| SUPPORT, ECOMMERCE | 4000 | Veloce |
| HR, EDUCATION | 6000 | Standard |
| FINANCE | 6000 | Standard |
| LEGAL, HEALTHCARE | 8000 | Contesto legale/medico completo |
| RESEARCH | 10000 | Analisi approfondita |
Abstain (Rifiuto risposta)
Configura quando l'AI ammette di non sapere. Critico per settori ad alta responsabilità.
| Parametro | Range | Impatto |
|---|---|---|
abstain.enabled | true/false | Attiva rifiuto automatico |
abstain.threshold | 0.0 - 1.0 | Soglia sotto cui rifiutare |
| Preset | Enabled | Threshold | Motivazione |
|---|---|---|---|
| HEALTHCARE | Si | 0.50 | Critico - vite in gioco |
| LEGAL | Si | 0.40 | Critico - responsabilità legale |
| FINANCE | Si | 0.35 | Importante - dati finanziari |
| HR, SUPPORT, RESEARCH, ECOMMERCE, EDUCATION | No | - | Meglio aiutare |
Importante
I preset HEALTHCARE e LEGAL hanno l'astensione abilitata perché fornire informazioni errate può avere conseguenze gravi. Se non trovano informazioni certe, rispondono con un messaggio di cautela.
Semantic Cache
Cache delle risposte per query simili. Utile per FAQ e domande ripetitive.
| Parametro | Range | Impatto |
|---|---|---|
semanticCache.enabled | true/false | Attiva cache semantica |
semanticCache.cosineThreshold | 0.8 - 0.99 | Similarità per cache hit |
semanticCache.ttlSeconds | 60 - 86400 | Durata cache (secondi) |
semanticCache.maxEntries | 100 - 10000 | Massimo entries |
| Preset | Enabled | Threshold | TTL | maxEntries |
|---|---|---|---|---|
| SUPPORT | Si | 0.90 | 2h | 2000 |
| EDUCATION | Si | 0.90 | 2h | 2000 |
| ECOMMERCE | Si | 0.91 | 1h | 3000 |
| HR, LEGAL, FINANCE, HEALTHCARE, RESEARCH | No | - | - | - |
Chunking (Automatico)
Gestione Automatica
A partire dalla versione 2.2.1, i parametri di chunking sono gestiti automaticamente dal sistema con valori ottimali basati su benchmark NVIDIA 2024.
Il sistema utilizza configurazioni ottimizzate:
| Parametro | Valore | Note |
|---|---|---|
| Chunk Size | ~2000 caratteri | ~500 tokens (ottimale NVIDIA benchmark) |
| Overlap | 15% | Bilanciamento contesto/ridondanza |
| Min Tokens | 50 | Filtra chunk troppo piccoli |
Perché automatico?
- Benchmark mostrano che 400-512 tokens è ottimale per RAG
- Chunking adattivo in base al tipo di documento (legal, table, technical)
- Quality validation automatica filtra chunk di bassa qualità
I parametri di chunking non sono più configurabili nei preset per garantire risultati consistenti.
Feature Toggles
Interruttori per attivare/disattivare funzionalità avanzate.
| Parametro | Descrizione |
|---|---|
features.aggregativeDetection | Rileva query tipo "elenca tutti..." |
features.sectorVerification | Verifica pertinenza al settore |
features.queryDecomposition | Scompone query complesse |
features.queryRewriting | Riscrive query per migliorare la ricerca |
features.cragEnabled | Attiva Corrective RAG |
features.aiSummaryEnabled | Genera riassunti AI |
features.sourceDeduplication | Rimuove fonti duplicate |
Preset per velocità (SUPPORT, ECOMMERCE): Disabilitano sectorVerification, queryDecomposition, cragEnabled per risposte più rapide.
Preset per precisione (LEGAL, HEALTHCARE, FINANCE, RESEARCH): Tutte le features abilitate per massima accuratezza.
Riepilogo per Caso d'Uso
Alta precisione (LEGAL, HEALTHCARE)
- Temperature: 0.0
- Soglie: alte (0.14-0.16)
- Reranker: strict (0.18-0.20)
- Abstain: abilitato
- Cache: disabilitata
Velocità (SUPPORT, ECOMMERCE)
- Temperature: 0.0-0.1
- topK: basso (15-20)
- Features: ridotte
- Cache: abilitata
- Abstain: disabilitato
Analisi approfondita (RESEARCH, HR)
- topK: alto (35-40)
- Context: ampio (6000-10000 tokens)
- MMR: abilitato (diversità)
- maxSources: alto (8-10)
Bilanciato (FINANCE, EDUCATION)
- Configurazione intermedia
- Buon compromesso precisione/velocità
- Recency: abilitato per FINANCE