Données

Base de Données Vectorielle

Une base de données optimisée pour le stockage et l'interrogation d'embeddings vectoriels haute dimension pour la recherche sémantique.

Explication détaillée

Une base de données vectorielle stocke les données sous forme de vecteurs haute dimension plutôt que de lignes et colonnes. Ces vecteurs sont générés par des modèles d'embedding qui capturent le sens sémantique du texte, des images ou d'autres données. Cela permet la recherche par similarité : au lieu de faire correspondre des mots-clés exacts, on peut trouver des données sémantiquement similaires. Les bases vectorielles populaires incluent Pinecone, Weaviate, Qdrant et pgvector.

Comment ça fonctionne

Génération d'embeddings

Les données brutes (texte, images) sont passées à travers un modèle d'embedding qui produit une représentation vectorielle de taille fixe.

Indexation

Les vecteurs sont stockés avec des métadonnées et indexés par des algorithmes HNSW ou IVF pour une recherche rapide.

Recherche de similarité

Un vecteur de requête est comparé aux vecteurs stockés en utilisant des métriques de distance (similarité cosinus).

Récupération des résultats

Les vecteurs les plus similaires sont retournés avec leurs métadonnées et contenu original associés.

Cas d'utilisation concrets

Recherche sémantique

Moteurs de recherche qui comprennent l'intention plutôt que les mots-clés, retournant des résultats contextuellement pertinents.

Pipelines RAG

Stockage d'embeddings de documents pour la génération augmentée par récupération dans les applications LLM.

Systèmes de recommandation

Trouver des produits, contenus ou utilisateurs similaires basés sur des embeddings comportementaux ou de contenu.

Termes associés

Rag Agentic Workflow Edge Computing

Services associés

Ai Machine Learning Data Engineering

Besoin d'aide pour implémenter ces concepts ?

Connaître la définition, c'est l'étape un. L'intégrer dans votre produit, c'est l'étape deux. C'est là que nous intervenons.

Retour au glossaire Consulter nos ingénieurs