ia

Embedding

Représentation numérique (vecteur) d'un texte, d'une image ou d'un concept dans un espace mathématique multidimensionnel.

Un embedding est une représentation vectorielle dense d'une donnée (texte, image, audio) dans un espace à plusieurs centaines ou milliers de dimensions. Les éléments sémantiquement proches sont proches dans cet espace vectoriel.

Les embeddings textuels permettent de mesurer la similarité entre phrases, de rechercher des documents pertinents et de construire des systèmes de RAG. Chaque phrase est convertie en un vecteur numérique via un modèle d'embedding.

Les modèles populaires incluent OpenAI text-embedding-3, Cohere Embed et les modèles open source comme BGE ou E5.

Termes associés