Un LLM (Large Language Model) est un modèle d'intelligence artificielle entraîné sur des milliards de tokens de texte. Les LLM les plus connus sont GPT (OpenAI), Claude (Anthropic), Gemini (Google) et Llama (Meta).
Ces modèles utilisent l'architecture Transformer et sont capables de générer du texte cohérent, répondre à des questions, résumer des documents, traduire et même écrire du code.
Les LLM sont au cœur de la révolution de l'IA générative et sont de plus en plus utilisés dans les entreprises pour l'automatisation, l'assistance client et l'analyse de données.