RAG (Retrieval-Augmented Generation)

Une technique qui améliore les réponses LLM en récupérant du contexte pertinent depuis des bases de connaissances externes.

Explication détaillée

Le Retrieval-Augmented Generation (RAG) adresse la limitation fondamentale des Large Language Models : ils ne peuvent répondre qu'à partir de leurs données d'entraînement. Le RAG résout cela en ajoutant une étape de récupération avant la génération. Le système recherche dans une base de données vectorielle de vos documents propriétaires, récupère les morceaux les plus pertinents et les injecte dans le prompt du LLM comme contexte.

Comment ça fonctionne

Ingestion de documents

Vos documents sont découpés en morceaux, convertis en embeddings vectoriels et stockés dans une base de données vectorielle.

Embedding de requête

La question de l'utilisateur est convertie en vecteur en utilisant le même modèle d'embedding.

Récupération sémantique

La base de données vectorielle effectue une recherche de similarité pour trouver les morceaux de documents les plus pertinents.

Génération augmentée

Les morceaux récupérés sont injectés comme contexte dans le prompt du LLM, et le modèle génère une réponse fondée.

Cas d'utilisation concrets

Base de connaissances entreprise

Les employés posent des questions en langage naturel et obtiennent des réponses sourced depuis la documentation interne.

Chatbot de support client

Un chatbot qui répond aux questions produit en utilisant votre documentation réelle, réduisant le risque d'hallucination.

Recherche juridique

Les avocats interrogent des bases de jurisprudence et reçoivent des réponses citées et contextuelles.

Termes associés

Agentic Workflow Vector Database

Services associés

Ai Machine Learning Ai Wrappers Data Engineering

Besoin d'aide pour implémenter ces concepts ?

Connaître la définition, c'est l'étape un. L'intégrer dans votre produit, c'est l'étape deux. C'est là que nous intervenons.

Retour au glossaire Consulter nos ingénieurs