ia

Transformer (IA)

Architecture de réseau de neurones, fondée sur le mécanisme d'attention, qui est à la base des grands modèles de langage modernes.

Introduit en 2017 par Google (« Attention is All You Need »), le Transformer traite les séquences en parallèle grâce à l'auto-attention, ce qui a rendu possible l'entraînement de modèles à des milliards de paramètres. C'est l'architecture sous-jacente de GPT, Claude, Gemini ou Llama.

Termes associés