Une base de données optimisée pour le stockage et l'interrogation d'embeddings vectoriels haute dimension pour la recherche sémantique.
Une base de données vectorielle stocke les données sous forme de vecteurs haute dimension plutôt que de lignes et colonnes. Ces vecteurs sont générés par des modèles d'embedding qui capturent le sens sémantique du texte, des images ou d'autres données. Cela permet la recherche par similarité : au lieu de faire correspondre des mots-clés exacts, on peut trouver des données sémantiquement similaires. Les bases vectorielles populaires incluent Pinecone, Weaviate, Qdrant et pgvector.
Les données brutes (texte, images) sont passées à travers un modèle d'embedding qui produit une représentation vectorielle de taille fixe.
Les vecteurs sont stockés avec des métadonnées et indexés par des algorithmes HNSW ou IVF pour une recherche rapide.
Un vecteur de requête est comparé aux vecteurs stockés en utilisant des métriques de distance (similarité cosinus).
Les vecteurs les plus similaires sont retournés avec leurs métadonnées et contenu original associés.
Moteurs de recherche qui comprennent l'intention plutôt que les mots-clés, retournant des résultats contextuellement pertinents.
Stockage d'embeddings de documents pour la génération augmentée par récupération dans les applications LLM.
Trouver des produits, contenus ou utilisateurs similaires basés sur des embeddings comportementaux ou de contenu.
Connaître la définition, c'est l'étape un. L'intégrer dans votre produit, c'est l'étape deux. C'est là que nous intervenons.