Le deep learning (apprentissage profond) repose sur des réseaux de neurones artificiels comportant de nombreuses couches (d'où le terme « profond »). Chaque couche transforme progressivement les données pour extraire des caractéristiques de plus en plus abstraites.
Les architectures courantes incluent les CNN (réseaux convolutifs, pour l'image), les RNN/LSTM (séquences temporelles) et les Transformers (à la base des LLM modernes comme GPT et Claude).
Le deep learning a permis des avancées majeures en reconnaissance d'images, traduction automatique, synthèse vocale et génération de texte.