IA & Machine Learning Article original TECH ACTU

GPT-Image-2 : l’héritier de DALL-E en test avant le 12 mai

Jean-Paul Lesein 5 min de lecture 182 vues
GPT-Image-2 : l’héritier de DALL-E en test avant le 12 mai

DALL-E s’arrête le 12 mai 2026. GPT-Image-2 tourne déjà en A/B test silencieux dans ChatGPT depuis début avril, après l’apparition fugace de trois codenames (maskingtape-alpha, gaffertape-alpha, packingtape-alpha) sur LM Arena. Premiers retours : texte à 99% de précision, résolution 4096x4096 pixels, architecture mono-passe, cohérence sur grilles 100 objets. Lancement officiel attendu avant le 12 mai. Analyse de la stratégie image d’OpenAI face à Midjourney V7 et Adobe Firefly 4.

DALL-E meurt le 12 mai 2026. OpenAI l’a confirmé dès novembre dernier : DALL-E 2 et DALL-E 3 seront coupés de l’API à cette date. Mais pendant que les développeurs cherchent leurs alternatives, quelque chose de discret se passe déjà dans ChatGPT. Des testeurs signalent un nouveau moteur de génération d’images — GPT-Image-2 — en déploiement silencieux depuis quelques jours. Pas d’annonce officielle. Pas de keynote. Juste des screenshots qui circulent avec un rendu de texte quasi parfait et une résolution qu’on n’avait pas vue venir.

DALL-E : la fin d’une ère, la date connue

Le 14 novembre 2025, OpenAI a publié une notice de dépréciation sobre : DALL-E 2 et DALL-E 3 seront retirés de l’API le 12 mai 2026. DALL-E 3 avait déjà été silencieusement retiré de ChatGPT en décembre 2025, sans annonce, remplacé par le pipeline GPT-4o image. La transition était déjà en cours — l’API suivra dans trois semaines.

Pour les développeurs qui intègrent encore DALL-E dans leurs applications, la migration est non-négociable. OpenAI recommande actuellement gpt-image-1.5 ou gpt-image-1-mini comme remplaçants officiels. Mais ces modèles ne sont pas GPT-Image-2 — et c’est là que l’histoire devient intéressante.

GPT-Image-2 en A/B test : les codenames qui ont tout révélé

Le 4 avril 2026, trois modèles anonymes sont apparus brièvement sur LM Arena (la plateforme de benchmarks blindés où les modèles s’affrontent sans dévoiler leur identité) : maskingtape-alpha, gaffertape-alpha, et packingtape-alpha. Tous retirés quelques heures après leur apparition. Les analystes ont rapidement identifié la signature OpenAI dans les comportements de génération.

Depuis, GPT-Image-2 fait l’objet d’un déploiement silencieux en A/B test dans ChatGPT Web et mobile. Certains utilisateurs le reçoivent sans le savoir, d’autres non — c’est la logique d’un rollout progressif avant lancement officiel. Les premiers retours sont unanimes : ce n’est pas une mise à jour incrémentale de gpt-image-1.5. C’est une rupture architecturale.

Ce que les testeurs ont observé : 5 sauts qualitatifs

1. Le texte enfin fiable. Le problème le plus caricatural de la génération d’images IA — les lettres déformées, les mots inventés, les hiéroglyphes pixelisés — semble résolu. Les testeurs rapportent un taux d’exactitude supérieur à 99 % sur le rendu textuel. Demander à GPT-Image-2 d’écrire « Bienvenue chez Pierre » sur une affiche donne... « Bienvenue chez Pierre ». Ce qui paraît trivial représente un changement radical pour tous les cas d’usage marketing, signalétique et UI design.

2. Résolution 4K native. GPT-Image-2 supporte une sortie jusqu’à 4096×4096 pixels, ainsi que le format 16:9. Pour la génération d’images destinées à l’impression, au fond d’écran ou à l’intégration dans des productions visuelles professionnelles, c’est la fin du passage obligé par des upscalers externes.

3. Architecture mono-passe. L’architecture précédente fonctionnait en deux étapes : une génération initiale, puis un affinement. GPT-Image-2 passe à un pipeline d’inférence unique, ce qui devrait se traduire par une génération plus rapide et plus cohérente. L’absence de couture entre deux étapes réduit les artefacts visuels typiques des modèles en deux temps.

4. Cohérence sur les grilles complexes. Un test qui a beaucoup circulé : générer une grille 10x10 de 100 objets distincts — une tâche qui faisait s’effondrer les modèles précédents en répétitions ou incohérences vers la 20e case. GPT-Image-2 maintient la cohérence sur les 100 éléments. C’est un indicateur indirect d’une meilleure gestion du contexte spatial global.

5. Connaissance du monde et photorealism. Les testeurs de LM Arena notaient que les modèles maskingtape/gaffertape/packingtape font passer Nano-Banana Pro de Google pour du DALL-E. La précision des références visuelles du monde réel — architectures, logos, objets de marque — semble nettement améliorée.

Fenêtre de lancement : avant le 12 mai, forcément

La logique est simple : DALL-E s’éteint le 12 mai 2026. OpenAI ne peut pas se retrouver sans modèle image standalone dans son API au moment de la dépréciation. Le déploiement A/B actuel suggère un lancement officiel entre fin avril et début mai.

Pour les développeurs qui utilisent encore l’API DALL-E, la question n’est plus si mais quand migrer. Les options actuelles (gpt-image-1.5, gpt-image-1-mini) sont des solutions de transition. GPT-Image-2 sera vraisemblablement le modèle de référence à partir du 12 mai — avec ou sans annonce fracassante en keynote.

Le choix d’un rollout silencieux n’est pas anodin. La dernière annonce image en fanfare — GPT-image-1 en mars 2025 — avait provoqué une surcharge des serveurs pendant 48h. Un déploiement progressif est une stratégie plus maîtrisée, même si elle prive OpenAI d’un momentum marketing immédiat.

Mon analyse : la guerre de l’image IA entre dans une nouvelle phase

La génération d’images IA est le segment qui s’est le plus fragmenté depuis 2024. Midjourney V7, Adobe Firefly 4 dans Creative Cloud, Google Imagen 4 dans Workspace, Stable Diffusion 4 en open source — OpenAI n’est plus seul, et sa position n’est plus dominante comme avec DALL-E 3 en 2022-2023.

GPT-Image-2 n’arrive pas sur un marché vierge. Il arrive sur un marché où le rendu de texte parfait et la résolution 4K sont déjà des attendus, pas des différenciateurs. Ce qui va compter, c’est l’intégration dans l’écosystème ChatGPT / API / Codex — et là, OpenAI a un avantage structurel que Midjourney n’a pas.

Ce que je retiens personnellement : la combinaison GPT-Image-2 + GPT-Rosalind (lancé le 17 avril pour les sciences de la vie) + GPT-5.4 montre qu’OpenAI est en train de verticaliser son offre modèle par modèle. Le modèle général, le modèle image, le modèle scientifique — chacun optimisé pour son domaine, tous connectés via l’API. C’est une architecture de plateforme, pas juste une course aux benchmarks.

Pour les équipes qui dépendent encore de DALL-E 3 : vous avez trois semaines. J’ai détaillé le guide de migration DALL-E 3 vers GPT-Image-2, les endpoints API concernés et les cas d’usage concrets dans mon article complet sur TECH ACTU — le lien est en commentaire.

Partager cet article

À lire aussi en IA & Machine Learning