ia

IA multimodale

IA capable de traiter et combiner plusieurs types de données : texte, image, audio et vidéo.

Un modèle multimodal comprend et génère plusieurs modalités à la fois — par exemple décrire une image, répondre à une question sur une vidéo ou générer du son. GPT-4o, Claude et Gemini sont multimodaux.

Termes associés