RAG (Retrieval-Augmented Generation)

Technique combinant recherche documentaire et génération par IA pour produire des réponses plus précises et à jour, ancrées dans des sources vérifiables.

Le RAG (Retrieval-Augmented Generation) est une architecture qui améliore les réponses des LLM en les combinant avec une recherche dans une base de connaissances externe. Au lieu de se fier uniquement à sa mémoire d'entraînement, le modèle consulte des documents pertinents avant de répondre.

Le processus se déroule en deux étapes : d'abord la récupération (retrieval) de documents pertinents via des embeddings vectoriels, puis la génération d'une réponse contextuelle par le LLM.

Le RAG est particulièrement utile en entreprise pour interroger des bases documentaires internes, des FAQ ou des bases de connaissances techniques.

Termes associés

Agent IASystème d'IA autonome capable de planifier, exécuter des actions et utiliser des outils pour accomplir des tâches complexes.EmbeddingReprésentation numérique (vecteur) d'un texte, d'une image ou d'un concept dans un espace mathématique multidimensionnel.LLM (Large Language Model)Modèle de langage de grande taille entraîné sur d'immenses corpus de texte, capable de comprendre et générer du langage naturel.

Retour au glossaire