Skip to content

Riferimento Parametri RAG

Questa guida descrive in dettaglio tutti i parametri configurabili nel sistema RAG. Ogni parametro influenza il comportamento dell'AI in modo specifico.

Solo per utenti avanzati

Questa pagina è pensata per amministratori che vogliono creare o modificare preset personalizzati. Per un uso normale, i preset predefiniti sono già ottimizzati.

Panoramica Preset Esistenti

Queria include 8 preset ottimizzati con parametri v1.4.0:

PresetSettoretopKTemperatureAbstainCacheMMR
LEGAL (Default)Legale250.0SiNoNo
HEALTHCARESanità250.0SiNoNo
FINANCEFinanza200.0SiNoNo
HRRisorse Umane350.0NoNoSi
RESEARCHRicerca400.0NoNoSi
SUPPORTSupporto150.1NoSiNo
ECOMMERCEE-Commerce200.0NoSiNo
EDUCATIONIstruzione220.1NoSiSi

Parametri del Modello (LLM)

Questi parametri controllano come il modello AI genera le risposte.

Temperature

ParametroRangeImpatto
llm.temperature0.0 - 1.0Creatività/determinismo

Cosa fa: Controlla quanto l'AI è "creativa" vs "deterministica".

ValoreComportamentoUsato da
0.0Massima precisione, risposte fattualiLEGAL, HEALTHCARE, FINANCE, HR, RESEARCH, ECOMMERCE
0.1Leggermente più naturale, buono per interazioniSUPPORT, EDUCATION

Consiglio

Per RAG documentale, la temperature è quasi sempre 0.0. Valori più alti aumentano il rischio di "allucinazioni".

Max Tokens

ParametroRangeImpatto
llm.maxTokens256 - 8192Lunghezza massima risposta

Valori per preset:

PresetmaxTokensUso
SUPPORT, ECOMMERCE1500Risposte brevi e concise
FINANCE, LEGAL, HEALTHCARE2000-2500Risposte medie
HR, EDUCATION2500-3000Analisi dettagliate
RESEARCH3500Analisi approfondite

Top P (Nucleus Sampling)

ParametroRangeImpatto
llm.topP0.0 - 1.0Diversità lessicale

Valori per preset:

  • 0.88: HEALTHCARE (molto focalizzato)
  • 0.90: LEGAL (focalizzato)
  • 0.92: FINANCE, RESEARCH (bilanciato)
  • 0.95: HR, SUPPORT, EDUCATION, ECOMMERCE (più naturale)

Parametri di Ricerca (Retrieval)

Questi parametri controllano come vengono recuperati i documenti rilevanti.

Top K

ParametroRangeImpatto
retrieval.topK5 - 100Numero documenti candidati

Cosa fa: Quanti "chunk" di documento vengono recuperati inizialmente dalla ricerca semantica.

PresettopKMotivazione
SUPPORT15Velocità
FINANCE20Precisione
ECOMMERCE20Velocità
EDUCATION22Bilanciato
LEGAL25Precisione
HEALTHCARE25Precisione
HR35Confronto candidati
RESEARCH40Copertura ampia

BM25 Top K

ParametroRangeImpatto
retrieval.bm25TopK5 - 50Risultati ricerca keyword

Cosa fa: Quanti risultati dalla ricerca per parole chiave (BM25) vengono considerati.

Presetbm25TopKNote
SUPPORT15Veloce
LEGAL, EDUCATION20Bilanciato
HEALTHCARE, FINANCE22Termini precisi
ECOMMERCE28SKU/codici prodotto
HR30Skills/keywords
RESEARCH35Copertura ampia

RRF Constant

ParametroRangeImpatto
retrieval.rrfConstant20 - 100Bilanciamento fusione risultati

Cosa fa: Parametro per la fusione dei risultati (Reciprocal Rank Fusion). Valori più alti danno più peso ai risultati in posizioni più basse.

ValorePresetEffetto
50SUPPORTPrivilegia top results
55HR, ECOMMERCEBilanciato
60FINANCE, EDUCATIONBilanciato
65RESEARCHInclude più risultati
70LEGAL, HEALTHCAREPiù bilanciato

Merged Top K

ParametroRangeImpatto
retrieval.mergedTopK5 - 50Risultati finali dopo fusione

Cosa fa: Quanti risultati vengono mantenuti dopo aver fuso ricerca semantica e BM25.

Range nei preset: 12 (SUPPORT) - 32 (RESEARCH)

Max Sources to Show

ParametroRangeImpatto
retrieval.maxSourcesToShow3 - 15Fonti visibili all'utente
PresetValoreMotivazione
SUPPORT3Risposte concise
LEGAL, HEALTHCARE, ECOMMERCE5Qualità
FINANCE, EDUCATION6Dettaglio
RESEARCH8Riferimenti multipli
HR10Confronto candidati

Soglie di Rilevanza

Questi parametri definiscono quando un documento è "abbastanza rilevante".

Specific Threshold

ParametroRangeImpatto
relevance.specificThreshold0.01 - 0.5Soglia query specifiche

Cosa fa: Soglia minima di similarità per query specifiche (es. "Qual è la data del contratto ACME?").

PrecisioneValorePreset
Tollerante0.05SUPPORT
Tollerante0.06HR
Moderata0.07ECOMMERCE
Moderata0.08RESEARCH, EDUCATION
Alta0.11FINANCE
Massima0.14LEGAL
Critica0.16HEALTHCARE

Aggregative Threshold

ParametroRangeImpatto
relevance.aggregativeThreshold0.01 - 0.3Soglia query aggregate

Cosa fa: Soglia per query che richiedono aggregazione (es. "Elenca tutti i fornitori").

Soglia più bassa perché deve catturare più risultati:

  • 0.03: HR, SUPPORT
  • 0.04: ECOMMERCE, RESEARCH, EDUCATION
  • 0.06: FINANCE
  • 0.08: LEGAL
  • 0.10: HEALTHCARE

Generic Threshold

ParametroRangeImpatto
relevance.genericThreshold0.01 - 0.3Soglia query generiche

Range nei preset: 0.04 (SUPPORT, HR) - 0.12 (HEALTHCARE)

BM25 Boost Weight

ParametroRangeImpatto
relevance.bm25BoostWeight0.0 - 1.0Peso ricerca keyword

Cosa fa: Quanto la corrispondenza esatta delle parole chiave aumenta lo score.

ValorePresetUso
0.25LEGAL, HEALTHCARE, RESEARCHSemantica prioritaria
0.30EDUCATIONBilanciato
0.32FINANCENumeri precisi
0.35HR, SUPPORTKeywords importanti
0.42ECOMMERCEForte - SKU/codici

Freshness Boost

ParametroRangeImpatto
relevance.freshnessBoost0.0 - 0.5Boost documenti recenti
ValorePresetMotivazione
0.05LEGAL, SUPPORTContenuti stabili
0.08EDUCATIONContenuti didattici stabili
0.10ECOMMERCEModerato
0.12HEALTHCARELinee guida si aggiornano
0.15HRCV recenti preferiti
0.20FINANCEDati fiscali recenti
0.25RESEARCHPaper recenti importanti

Configurazione Reranker

Il reranker è un secondo passaggio che riordina i risultati per maggiore precisione.

Enabled

ParametroValoriImpatto
reranker.enabledtrue/falseAttiva/disattiva reranking

Tutti i preset hanno il reranker abilitato per massimizzare la qualità.

Reranker Top K

ParametroRangeImpatto
reranker.topK5 - 30Risultati dopo reranking
PresettopKNote
SUPPORT6Veloce
LEGAL, HEALTHCARE, ECOMMERCE8Qualità
FINANCE, EDUCATION10Bilanciato
RESEARCH14Ampio
HR15Confronto

Score Threshold

ParametroRangeImpatto
reranker.scoreThreshold0.0 - 1.0Soglia minima reranking
PrecisioneValorePreset
Tollerante0.08HR, SUPPORT
Moderata0.10RESEARCH, EDUCATION, ECOMMERCE
Alta0.14FINANCE
Massima0.18LEGAL
Critica0.20HEALTHCARE

Min Results

ParametroRangeImpatto
reranker.minResults1 - 10Risultati minimi garantiti
PresetValoreNote
HEALTHCARE2Solo se rilevanti
LEGAL, SUPPORT3Qualità
FINANCE, ECOMMERCE4Bilanciato
EDUCATION5Didattico
RESEARCH6Comprensivo
HR8Confronto candidati

Bilanciamento Dual RAG

Questi parametri controllano come vengono bilanciate le due sorgenti dati: Knowledge Base e Documenti Utente.

Document Weight

ParametroRangeImpatto
sourceBalance.documentWeight0.0 - 1.0Peso documenti utente
PresetdocWeightkbWeightPriorità
SUPPORT0.300.70Knowledge (FAQ)
LEGAL0.400.60Knowledge (normative)
HEALTHCARE0.450.55Knowledge (protocolli)
RESEARCH, EDUCATION0.550.45Bilanciato
FINANCE0.650.35Documenti
ECOMMERCE0.800.20Documenti (prodotti)
HR0.850.15Documenti (CV)

Min Documents / Min Knowledge

ParametroRangeImpatto
sourceBalance.minDocuments0 - 10Minimo da documenti
sourceBalance.minKnowledge0 - 10Minimo da knowledge
PresetminDocsminKBNote
SUPPORT02Focus su FAQ
ECOMMERCE20Focus su prodotti
HR30Confronto candidati
LEGAL, HEALTHCARE13Sempre riferimenti normativi
FINANCE21Bilanciato
RESEARCH, EDUCATION22Bilanciato

Parametri Avanzati (v1.4.0)

MMR (Maximal Marginal Relevance)

Evita risultati troppo simili tra loro.

ParametroRangeImpatto
mmr.enabledtrue/falseAttiva diversificazione
mmr.lambda0.0 - 1.0Bilanciamento rilevanza/diversità
PresetEnabledLambdaMotivazione
HRSi0.60Diversificare candidati
RESEARCHSi0.60Diversificare fonti
EDUCATIONSi0.65Diversificare contenuti
LEGAL, HEALTHCARE, FINANCE, SUPPORT, ECOMMERCENo-Precisione prioritaria

Lambda:

  • 0.5-0.6: Massima diversità
  • 0.65-0.7: Bilanciato
  • 1.0: Solo rilevanza

Recency Boost

Favorisce documenti più recenti.

ParametroRangeImpatto
recency.enabledtrue/falseAttiva boost temporale
recency.halfLifeDays30 - 365Giorni per dimezzare il boost
recency.maxBoost0.0 - 0.5Boost massimo per doc nuovi
PresetEnabledhalfLifemaxBoost
HRSi1800.15
FINANCESi3650.20
HEALTHCARESi3650.15
LEGALSi3650.10
RESEARCHSi3650.25
SUPPORT, ECOMMERCE, EDUCATIONNo--

Context Window

Gestione del contesto inviato al modello.

ParametroRangeImpatto
context.maxTokens2000 - 16000Token massimi di contesto
PresetmaxTokensNote
SUPPORT, ECOMMERCE4000Veloce
HR, EDUCATION6000Standard
FINANCE6000Standard
LEGAL, HEALTHCARE8000Contesto legale/medico completo
RESEARCH10000Analisi approfondita

Abstain (Rifiuto risposta)

Configura quando l'AI ammette di non sapere. Critico per settori ad alta responsabilità.

ParametroRangeImpatto
abstain.enabledtrue/falseAttiva rifiuto automatico
abstain.threshold0.0 - 1.0Soglia sotto cui rifiutare
PresetEnabledThresholdMotivazione
HEALTHCARESi0.50Critico - vite in gioco
LEGALSi0.40Critico - responsabilità legale
FINANCESi0.35Importante - dati finanziari
HR, SUPPORT, RESEARCH, ECOMMERCE, EDUCATIONNo-Meglio aiutare

Importante

I preset HEALTHCARE e LEGAL hanno l'astensione abilitata perché fornire informazioni errate può avere conseguenze gravi. Se non trovano informazioni certe, rispondono con un messaggio di cautela.

Semantic Cache

Cache delle risposte per query simili. Utile per FAQ e domande ripetitive.

ParametroRangeImpatto
semanticCache.enabledtrue/falseAttiva cache semantica
semanticCache.cosineThreshold0.8 - 0.99Similarità per cache hit
semanticCache.ttlSeconds60 - 86400Durata cache (secondi)
semanticCache.maxEntries100 - 10000Massimo entries
PresetEnabledThresholdTTLmaxEntries
SUPPORTSi0.902h2000
EDUCATIONSi0.902h2000
ECOMMERCESi0.911h3000
HR, LEGAL, FINANCE, HEALTHCARE, RESEARCHNo---

Chunking (Automatico)

Gestione Automatica

A partire dalla versione 2.2.1, i parametri di chunking sono gestiti automaticamente dal sistema con valori ottimali basati su benchmark NVIDIA 2024.

Il sistema utilizza configurazioni ottimizzate:

ParametroValoreNote
Chunk Size~2000 caratteri~500 tokens (ottimale NVIDIA benchmark)
Overlap15%Bilanciamento contesto/ridondanza
Min Tokens50Filtra chunk troppo piccoli

Perché automatico?

  • Benchmark mostrano che 400-512 tokens è ottimale per RAG
  • Chunking adattivo in base al tipo di documento (legal, table, technical)
  • Quality validation automatica filtra chunk di bassa qualità

I parametri di chunking non sono più configurabili nei preset per garantire risultati consistenti.


Feature Toggles

Interruttori per attivare/disattivare funzionalità avanzate.

ParametroDescrizione
features.aggregativeDetectionRileva query tipo "elenca tutti..."
features.sectorVerificationVerifica pertinenza al settore
features.queryDecompositionScompone query complesse
features.queryRewritingRiscrive query per migliorare la ricerca
features.cragEnabledAttiva Corrective RAG
features.aiSummaryEnabledGenera riassunti AI
features.sourceDeduplicationRimuove fonti duplicate

Preset per velocità (SUPPORT, ECOMMERCE): Disabilitano sectorVerification, queryDecomposition, cragEnabled per risposte più rapide.

Preset per precisione (LEGAL, HEALTHCARE, FINANCE, RESEARCH): Tutte le features abilitate per massima accuratezza.


Riepilogo per Caso d'Uso

  • Temperature: 0.0
  • Soglie: alte (0.14-0.16)
  • Reranker: strict (0.18-0.20)
  • Abstain: abilitato
  • Cache: disabilitata

Velocità (SUPPORT, ECOMMERCE)

  • Temperature: 0.0-0.1
  • topK: basso (15-20)
  • Features: ridotte
  • Cache: abilitata
  • Abstain: disabilitato

Analisi approfondita (RESEARCH, HR)

  • topK: alto (35-40)
  • Context: ampio (6000-10000 tokens)
  • MMR: abilitato (diversità)
  • maxSources: alto (8-10)

Bilanciato (FINANCE, EDUCATION)

  • Configurazione intermedia
  • Buon compromesso precisione/velocità
  • Recency: abilitato per FINANCE

Queria - Two-Tier Retrieval System