RAG (Retrieval-Augmented Generation)

Eine Technik, die LLM-Antworten durch Abruf relevanten Kontexts aus externen Wissensbasen verbessert.

Detaillierte Erklärung

Retrieval-Augmented Generation (RAG) adressiert die grundlegende Einschränkung von Large Language Models: Sie können nur basierend auf ihren Trainingsdaten antworten. RAG löst dies durch einen Retrieval-Schritt vor der Generierung. Das System durchsucht eine Vektordatenbank Ihrer proprietären Dokumente, ruft die relevantesten Abschnitte ab und injiziert sie als Kontext in den LLM-Prompt.

So funktioniert es

Dokumentenaufnahme

Ihre Dokumente werden in Chunks aufgeteilt, in Vektor-Embeddings konvertiert und in einer Vektordatenbank gespeichert.

Query-Embedding

Die Benutzerfrage wird mit demselben Embedding-Modell in einen Vektor konvertiert.

Semantischer Abruf

Die Vektordatenbank führt eine Ähnlichkeitssuche durch, um die relevantesten Dokumenten-Chunks zu finden.

Augmentierte Generierung

Die abgerufenen Chunks werden als Kontext in den LLM-Prompt injiziert, und das Modell generiert eine fundierte Antwort.

Praxisbeispiele

Unternehmens-Wissensbasis

Mitarbeiter stellen Fragen in natürlicher Sprache und erhalten Antworten aus interner Dokumentation.

Kundensupport-Chatbot

Ein Chatbot, der Produktfragen anhand Ihrer tatsächlichen Produktdokumentation beantwortet.

Juristische Recherche

Anwälte durchsuchen Rechtsprechungsdatenbanken und erhalten zitierte, kontextuelle Antworten.

Brauchen Sie Hilfe bei der Umsetzung?

Die Definition zu kennen ist Schritt eins. Es in Ihr Produkt einzubauen ist Schritt zwei. Dabei kommen wir ins Spiel.

Zurück zum Glossar Mit Ingenieuren beraten

RAG (Retrieval-Augmented Generation)

Detaillierte Erklärung

So funktioniert es

Dokumentenaufnahme

Query-Embedding

Semantischer Abruf

Augmentierte Generierung

Praxisbeispiele

Unternehmens-Wissensbasis

Kundensupport-Chatbot

Juristische Recherche

Verwandte Begriffe

Verwandte Dienste

Brauchen Sie Hilfe bei der Umsetzung?

RAG (Retrieval-Augmented Generation)

Detaillierte Erklärung

So funktioniert es

Dokumentenaufnahme

Query-Embedding

Semantischer Abruf

Augmentierte Generierung

Praxisbeispiele

Unternehmens-Wissensbasis

Kundensupport-Chatbot

Juristische Recherche

Verwandte Begriffe

Verwandte Dienste

Brauchen Sie Hilfe bei der Umsetzung?