Eine Datenbank, optimiert für Speicherung und Abfrage hochdimensionaler Vektor-Embeddings für semantische Suche.
Eine Vektordatenbank speichert Daten als hochdimensionale Vektoren anstelle von Zeilen und Spalten. Diese Vektoren werden von Embedding-Modellen generiert, die die semantische Bedeutung von Text, Bildern oder anderen Daten erfassen. Dies ermöglicht Ähnlichkeitssuche: Anstatt exakte Schlüsselwörter abzugleichen, kann man Daten finden, die semantisch ähnlich zur Abfrage sind. Populäre Vektordatenbanken sind Pinecone, Weaviate, Qdrant und pgvector.
Rohdaten (Text, Bilder) werden durch ein Embedding-Modell geleitet, das eine Vektordarstellung fester Größe ausgibt.
Vektoren werden mit Metadaten gespeichert und mittels HNSW- oder IVF-Algorithmen für schnelle Näherungssuche indexiert.
Ein Abfragevektor wird mit gespeicherten Vektoren mittels Distanzmetriken verglichen.
Die ähnlichsten Vektoren werden mit ihren zugehörigen Metadaten und Originalinhalten zurückgegeben.
Suchmaschinen, die Absicht statt nur Schlüsselwörter verstehen und kontextuell relevante Ergebnisse liefern.
Speicherung von Dokument-Embeddings für Retrieval-Augmented Generation in LLM-Anwendungen.
Finden ähnlicher Produkte, Inhalte oder Nutzer basierend auf Verhaltens- oder Inhalts-Embeddings.
Die Definition zu kennen ist Schritt eins. Es in Ihr Produkt einzubauen ist Schritt zwei. Dabei kommen wir ins Spiel.