References for RAG
RAGProcessor
Processeur RAG (Retrieval-Augmented Generation) optimisé pour petits LLM.
Cette classe orchestre la récupération de documents pertinents et leur utilisation pour générer des réponses avec un petit modèle LLM Qwen3.
| Parameters: |
|
|---|
| Attributes: |
|
|---|
__init__(model_loader, search_engine, db_session, max_tokens_per_doc=300, max_docs=5)
Initialise le processeur RAG.
| Parameters: |
|
|---|
format_context(search_results)
Formate les résultats de recherche en contexte structuré pour le LLM.
Utilise les résultats d'une requête pour créer un contexte formaté qui sera utilisé dans le prompt envoyé au modèle LLM.
| Parameters: |
|
|---|
| Returns: |
|
|---|
get_prompt_template(query, context, prompt_type='standard', **kwargs)
Retourne un template de prompt adapté au type de requête.
| Parameters: |
|
|---|
| Returns: |
|
|---|
| Raises: |
|
|---|
retrieve_and_generate(query, filters=None, prompt_type='standard', generation_kwargs=None, enable_thinking=None, **prompt_kwargs)
async
Récupère les documents pertinents et génère une réponse.
| Parameters: |
|
|---|
| Returns: |
|
|---|
retrieve_and_generate_stream(query, filters=None, prompt_type='standard', generation_kwargs=None, enable_thinking=None, **prompt_kwargs)
async
Récupère les documents pertinents et génère une réponse en streaming.
Cette méthode enrichit la réponse avec les documents utilisés pour la génération. Chaque fragment retourné est un dictionnaire identifiant son type et contenu.
| Parameters: |
|
|---|
| Yields: |
|
|---|
retrieve_documents(query, filters=None)
async
Récupère les documents pertinents pour une requête donnée.
Effectue une recherche dans la base de données vectorielle et retourne les résultats formatés selon le schéma standard de l'application.
| Parameters: |
|
|---|
| Returns: |
|
|---|