Riferimento Parametri RAG

Questa guida descrive in dettaglio tutti i parametri configurabili nel sistema RAG. Ogni parametro influenza il comportamento dell'AI in modo specifico.

Solo per utenti avanzati

Questa pagina è pensata per amministratori che vogliono creare o modificare preset personalizzati. Per un uso normale, i preset predefiniti sono già ottimizzati.

Panoramica Preset Esistenti

Queria include 8 preset ottimizzati con parametri v1.4.0:

Preset	Settore	topK	Temperature	Abstain	Cache	MMR
LEGAL (Default)	Legale	25	0.0	Si	No	No
HEALTHCARE	Sanità	25	0.0	Si	No	No
FINANCE	Finanza	20	0.0	Si	No	No
HR	Risorse Umane	35	0.0	No	No	Si
RESEARCH	Ricerca	40	0.0	No	No	Si
SUPPORT	Supporto	15	0.1	No	Si	No
ECOMMERCE	E-Commerce	20	0.0	No	Si	No
EDUCATION	Istruzione	22	0.1	No	Si	Si

Parametri del Modello (LLM)

Questi parametri controllano come il modello AI genera le risposte.

Temperature

Parametro	Range	Impatto
`llm.temperature`	0.0 - 1.0	Creatività/determinismo

Cosa fa: Controlla quanto l'AI è "creativa" vs "deterministica".

Valore	Comportamento	Usato da
0.0	Massima precisione, risposte fattuali	LEGAL, HEALTHCARE, FINANCE, HR, RESEARCH, ECOMMERCE
0.1	Leggermente più naturale, buono per interazioni	SUPPORT, EDUCATION

Consiglio

Per RAG documentale, la temperature è quasi sempre 0.0. Valori più alti aumentano il rischio di "allucinazioni".

Max Tokens

Parametro	Range	Impatto
`llm.maxTokens`	256 - 8192	Lunghezza massima risposta

Valori per preset:

Preset	maxTokens	Uso
SUPPORT, ECOMMERCE	1500	Risposte brevi e concise
FINANCE, LEGAL, HEALTHCARE	2000-2500	Risposte medie
HR, EDUCATION	2500-3000	Analisi dettagliate
RESEARCH	3500	Analisi approfondite

Top P (Nucleus Sampling)

Parametro	Range	Impatto
`llm.topP`	0.0 - 1.0	Diversità lessicale

Valori per preset:

0.88: HEALTHCARE (molto focalizzato)
0.90: LEGAL (focalizzato)
0.92: FINANCE, RESEARCH (bilanciato)
0.95: HR, SUPPORT, EDUCATION, ECOMMERCE (più naturale)

Parametri di Ricerca (Retrieval)

Questi parametri controllano come vengono recuperati i documenti rilevanti.

Top K

Parametro	Range	Impatto
`retrieval.topK`	5 - 100	Numero documenti candidati

Cosa fa: Quanti "chunk" di documento vengono recuperati inizialmente dalla ricerca semantica.

Preset	topK	Motivazione
SUPPORT	15	Velocità
FINANCE	20	Precisione
ECOMMERCE	20	Velocità
EDUCATION	22	Bilanciato
LEGAL	25	Precisione
HEALTHCARE	25	Precisione
HR	35	Confronto candidati
RESEARCH	40	Copertura ampia

BM25 Top K

Parametro	Range	Impatto
`retrieval.bm25TopK`	5 - 50	Risultati ricerca keyword

Cosa fa: Quanti risultati dalla ricerca per parole chiave (BM25) vengono considerati.

Preset	bm25TopK	Note
SUPPORT	15	Veloce
LEGAL, EDUCATION	20	Bilanciato
HEALTHCARE, FINANCE	22	Termini precisi
ECOMMERCE	28	SKU/codici prodotto
HR	30	Skills/keywords
RESEARCH	35	Copertura ampia

RRF Constant

Parametro	Range	Impatto
`retrieval.rrfConstant`	20 - 100	Bilanciamento fusione risultati

Cosa fa: Parametro per la fusione dei risultati (Reciprocal Rank Fusion). Valori più alti danno più peso ai risultati in posizioni più basse.

Valore	Preset	Effetto
50	SUPPORT	Privilegia top results
55	HR, ECOMMERCE	Bilanciato
60	FINANCE, EDUCATION	Bilanciato
65	RESEARCH	Include più risultati
70	LEGAL, HEALTHCARE	Più bilanciato

Merged Top K

Parametro	Range	Impatto
`retrieval.mergedTopK`	5 - 50	Risultati finali dopo fusione

Cosa fa: Quanti risultati vengono mantenuti dopo aver fuso ricerca semantica e BM25.

Range nei preset: 12 (SUPPORT) - 32 (RESEARCH)

Max Sources to Show

Parametro	Range	Impatto
`retrieval.maxSourcesToShow`	3 - 15	Fonti visibili all'utente

Preset	Valore	Motivazione
SUPPORT	3	Risposte concise
LEGAL, HEALTHCARE, ECOMMERCE	5	Qualità
FINANCE, EDUCATION	6	Dettaglio
RESEARCH	8	Riferimenti multipli
HR	10	Confronto candidati

Soglie di Rilevanza

Questi parametri definiscono quando un documento è "abbastanza rilevante".

Specific Threshold

Parametro	Range	Impatto
`relevance.specificThreshold`	0.01 - 0.5	Soglia query specifiche

Cosa fa: Soglia minima di similarità per query specifiche (es. "Qual è la data del contratto ACME?").

Precisione	Valore	Preset
Tollerante	0.05	SUPPORT
Tollerante	0.06	HR
Moderata	0.07	ECOMMERCE
Moderata	0.08	RESEARCH, EDUCATION
Alta	0.11	FINANCE
Massima	0.14	LEGAL
Critica	0.16	HEALTHCARE

Aggregative Threshold

Parametro	Range	Impatto
`relevance.aggregativeThreshold`	0.01 - 0.3	Soglia query aggregate

Cosa fa: Soglia per query che richiedono aggregazione (es. "Elenca tutti i fornitori").

Soglia più bassa perché deve catturare più risultati:

0.03: HR, SUPPORT
0.04: ECOMMERCE, RESEARCH, EDUCATION
0.06: FINANCE
0.08: LEGAL
0.10: HEALTHCARE

Generic Threshold

Parametro	Range	Impatto
`relevance.genericThreshold`	0.01 - 0.3	Soglia query generiche

Range nei preset: 0.04 (SUPPORT, HR) - 0.12 (HEALTHCARE)

BM25 Boost Weight

Parametro	Range	Impatto
`relevance.bm25BoostWeight`	0.0 - 1.0	Peso ricerca keyword

Cosa fa: Quanto la corrispondenza esatta delle parole chiave aumenta lo score.

Valore	Preset	Uso
0.25	LEGAL, HEALTHCARE, RESEARCH	Semantica prioritaria
0.30	EDUCATION	Bilanciato
0.32	FINANCE	Numeri precisi
0.35	HR, SUPPORT	Keywords importanti
0.42	ECOMMERCE	Forte - SKU/codici

Freshness Boost

Parametro	Range	Impatto
`relevance.freshnessBoost`	0.0 - 0.5	Boost documenti recenti

Valore	Preset	Motivazione
0.05	LEGAL, SUPPORT	Contenuti stabili
0.08	EDUCATION	Contenuti didattici stabili
0.10	ECOMMERCE	Moderato
0.12	HEALTHCARE	Linee guida si aggiornano
0.15	HR	CV recenti preferiti
0.20	FINANCE	Dati fiscali recenti
0.25	RESEARCH	Paper recenti importanti

Configurazione Reranker

Il reranker è un secondo passaggio che riordina i risultati per maggiore precisione.

Enabled

Parametro	Valori	Impatto
`reranker.enabled`	true/false	Attiva/disattiva reranking

Tutti i preset hanno il reranker abilitato per massimizzare la qualità.

Reranker Top K

Parametro	Range	Impatto
`reranker.topK`	5 - 30	Risultati dopo reranking

Preset	topK	Note
SUPPORT	6	Veloce
LEGAL, HEALTHCARE, ECOMMERCE	8	Qualità
FINANCE, EDUCATION	10	Bilanciato
RESEARCH	14	Ampio
HR	15	Confronto

Score Threshold

Parametro	Range	Impatto
`reranker.scoreThreshold`	0.0 - 1.0	Soglia minima reranking

Precisione	Valore	Preset
Tollerante	0.08	HR, SUPPORT
Moderata	0.10	RESEARCH, EDUCATION, ECOMMERCE
Alta	0.14	FINANCE
Massima	0.18	LEGAL
Critica	0.20	HEALTHCARE

Min Results

Parametro	Range	Impatto
`reranker.minResults`	1 - 10	Risultati minimi garantiti

Preset	Valore	Note
HEALTHCARE	2	Solo se rilevanti
LEGAL, SUPPORT	3	Qualità
FINANCE, ECOMMERCE	4	Bilanciato
EDUCATION	5	Didattico
RESEARCH	6	Comprensivo
HR	8	Confronto candidati

Bilanciamento Dual RAG

Questi parametri controllano come vengono bilanciate le due sorgenti dati: Knowledge Base e Documenti Utente.

Document Weight

Parametro	Range	Impatto
`sourceBalance.documentWeight`	0.0 - 1.0	Peso documenti utente

Preset	docWeight	kbWeight	Priorità
SUPPORT	0.30	0.70	Knowledge (FAQ)
LEGAL	0.40	0.60	Knowledge (normative)
HEALTHCARE	0.45	0.55	Knowledge (protocolli)
RESEARCH, EDUCATION	0.55	0.45	Bilanciato
FINANCE	0.65	0.35	Documenti
ECOMMERCE	0.80	0.20	Documenti (prodotti)
HR	0.85	0.15	Documenti (CV)

Min Documents / Min Knowledge

Parametro	Range	Impatto
`sourceBalance.minDocuments`	0 - 10	Minimo da documenti
`sourceBalance.minKnowledge`	0 - 10	Minimo da knowledge

Preset	minDocs	minKB	Note
SUPPORT	0	2	Focus su FAQ
ECOMMERCE	2	0	Focus su prodotti
HR	3	0	Confronto candidati
LEGAL, HEALTHCARE	1	3	Sempre riferimenti normativi
FINANCE	2	1	Bilanciato
RESEARCH, EDUCATION	2	2	Bilanciato

Parametri Avanzati (v1.4.0)

MMR (Maximal Marginal Relevance)

Evita risultati troppo simili tra loro.

Parametro	Range	Impatto
`mmr.enabled`	true/false	Attiva diversificazione
`mmr.lambda`	0.0 - 1.0	Bilanciamento rilevanza/diversità

Preset	Enabled	Lambda	Motivazione
HR	Si	0.60	Diversificare candidati
RESEARCH	Si	0.60	Diversificare fonti
EDUCATION	Si	0.65	Diversificare contenuti
LEGAL, HEALTHCARE, FINANCE, SUPPORT, ECOMMERCE	No	-	Precisione prioritaria

Lambda:

0.5-0.6: Massima diversità
0.65-0.7: Bilanciato
1.0: Solo rilevanza

Recency Boost

Favorisce documenti più recenti.

Parametro	Range	Impatto
`recency.enabled`	true/false	Attiva boost temporale
`recency.halfLifeDays`	30 - 365	Giorni per dimezzare il boost
`recency.maxBoost`	0.0 - 0.5	Boost massimo per doc nuovi

Preset	Enabled	halfLife	maxBoost
HR	Si	180	0.15
FINANCE	Si	365	0.20
HEALTHCARE	Si	365	0.15
LEGAL	Si	365	0.10
RESEARCH	Si	365	0.25
SUPPORT, ECOMMERCE, EDUCATION	No	-	-

Context Window

Gestione del contesto inviato al modello.

Parametro	Range	Impatto
`context.maxTokens`	2000 - 16000	Token massimi di contesto

Preset	maxTokens	Note
SUPPORT, ECOMMERCE	4000	Veloce
HR, EDUCATION	6000	Standard
FINANCE	6000	Standard
LEGAL, HEALTHCARE	8000	Contesto legale/medico completo
RESEARCH	10000	Analisi approfondita

Abstain (Rifiuto risposta)

Configura quando l'AI ammette di non sapere. Critico per settori ad alta responsabilità.

Parametro	Range	Impatto
`abstain.enabled`	true/false	Attiva rifiuto automatico
`abstain.threshold`	0.0 - 1.0	Soglia sotto cui rifiutare

Preset	Enabled	Threshold	Motivazione
HEALTHCARE	Si	0.50	Critico - vite in gioco
LEGAL	Si	0.40	Critico - responsabilità legale
FINANCE	Si	0.35	Importante - dati finanziari
HR, SUPPORT, RESEARCH, ECOMMERCE, EDUCATION	No	-	Meglio aiutare

Importante

I preset HEALTHCARE e LEGAL hanno l'astensione abilitata perché fornire informazioni errate può avere conseguenze gravi. Se non trovano informazioni certe, rispondono con un messaggio di cautela.

Semantic Cache

Cache delle risposte per query simili. Utile per FAQ e domande ripetitive.

Parametro	Range	Impatto
`semanticCache.enabled`	true/false	Attiva cache semantica
`semanticCache.cosineThreshold`	0.8 - 0.99	Similarità per cache hit
`semanticCache.ttlSeconds`	60 - 86400	Durata cache (secondi)
`semanticCache.maxEntries`	100 - 10000	Massimo entries

Preset	Enabled	Threshold	TTL	maxEntries
SUPPORT	Si	0.90	2h	2000
EDUCATION	Si	0.90	2h	2000
ECOMMERCE	Si	0.91	1h	3000
HR, LEGAL, FINANCE, HEALTHCARE, RESEARCH	No	-	-	-

Chunking (Automatico)

Gestione Automatica

A partire dalla versione 2.2.1, i parametri di chunking sono gestiti automaticamente dal sistema con valori ottimali basati su benchmark NVIDIA 2024.

Il sistema utilizza configurazioni ottimizzate:

Parametro	Valore	Note
Chunk Size	~2000 caratteri	~500 tokens (ottimale NVIDIA benchmark)
Overlap	15%	Bilanciamento contesto/ridondanza
Min Tokens	50	Filtra chunk troppo piccoli

Perché automatico?

Benchmark mostrano che 400-512 tokens è ottimale per RAG
Chunking adattivo in base al tipo di documento (legal, table, technical)
Quality validation automatica filtra chunk di bassa qualità

I parametri di chunking non sono più configurabili nei preset per garantire risultati consistenti.

Feature Toggles

Interruttori per attivare/disattivare funzionalità avanzate.

Parametro	Descrizione
`features.aggregativeDetection`	Rileva query tipo "elenca tutti..."
`features.sectorVerification`	Verifica pertinenza al settore
`features.queryDecomposition`	Scompone query complesse
`features.queryRewriting`	Riscrive query per migliorare la ricerca
`features.cragEnabled`	Attiva Corrective RAG
`features.aiSummaryEnabled`	Genera riassunti AI
`features.sourceDeduplication`	Rimuove fonti duplicate

Preset per velocità (SUPPORT, ECOMMERCE): Disabilitano sectorVerification, queryDecomposition, cragEnabled per risposte più rapide.

Preset per precisione (LEGAL, HEALTHCARE, FINANCE, RESEARCH): Tutte le features abilitate per massima accuratezza.

Riepilogo per Caso d'Uso

Alta precisione (LEGAL, HEALTHCARE)

Temperature: 0.0
Soglie: alte (0.14-0.16)
Reranker: strict (0.18-0.20)
Abstain: abilitato
Cache: disabilitata

Velocità (SUPPORT, ECOMMERCE)

Temperature: 0.0-0.1
topK: basso (15-20)
Features: ridotte
Cache: abilitata
Abstain: disabilitato

Analisi approfondita (RESEARCH, HR)

topK: alto (35-40)
Context: ampio (6000-10000 tokens)
MMR: abilitato (diversità)
maxSources: alto (8-10)

Bilanciato (FINANCE, EDUCATION)

Configurazione intermedia
Buon compromesso precisione/velocità
Recency: abilitato per FINANCE

Riferimento Parametri RAG ​

Panoramica Preset Esistenti ​

Parametri del Modello (LLM) ​

Temperature ​

Max Tokens ​

Top P (Nucleus Sampling) ​

Parametri di Ricerca (Retrieval) ​

Top K ​

BM25 Top K ​

RRF Constant ​

Merged Top K ​

Max Sources to Show ​

Soglie di Rilevanza ​

Specific Threshold ​

Aggregative Threshold ​

Generic Threshold ​

BM25 Boost Weight ​

Freshness Boost ​

Configurazione Reranker ​

Enabled ​

Reranker Top K ​

Score Threshold ​

Min Results ​

Bilanciamento Dual RAG ​

Document Weight ​

Min Documents / Min Knowledge ​

Parametri Avanzati (v1.4.0) ​

MMR (Maximal Marginal Relevance) ​

Recency Boost ​

Context Window ​

Abstain (Rifiuto risposta) ​

Semantic Cache ​

Chunking (Automatico) ​

Feature Toggles ​

Riepilogo per Caso d'Uso ​

Alta precisione (LEGAL, HEALTHCARE) ​

Velocità (SUPPORT, ECOMMERCE) ​

Analisi approfondita (RESEARCH, HR) ​

Bilanciato (FINANCE, EDUCATION) ​