OpenAI a présenté ce mardi 21 avril 2026 GPT-Image-2, la nouvelle version de son générateur d’images intégré à ChatGPT. Au menu : rendu de texte quasi parfait, résolution 2K, mode raisonnement pour les abonnés payants et API dédiée pour les développeurs. Le modèle est accessible dès cette semaine à tous les utilisateurs de ChatGPT et de Codex.</strong></p> <p class= »article-byline »>
La mise à jour, dévoilée lors d’un livestream suivi par toute la communauté IA, arrive un an après la première version. Les équipes d’OpenAI parlent d’un véritable « step change » par rapport à la génération précédente. Les premiers retours, notamment ceux de TechCrunch et d’Axios, confirment un changement de registre côté qualité.
Le texte dans l’image, la grande avancée
C’est la caractéristique qui capte toute l’attention des testeurs. GPT-Image-2 sait écrire du texte lisible et correctement orthographié à l’intérieur d’une image, aussi bien en alphabet latin qu’en caractères CJK (chinois, japonais, coréen).
Concrètement, cela change tout pour les visuels pro : enseignes de boutiques fictives, étiquettes de packaging, mockups d’interfaces applicatives, affiches promotionnelles ou notes manuscrites. Les générateurs concurrents butaient jusqu’ici sur cette limite, produisant souvent des lettres déformées ou des mots tronqués. Le modèle gère désormais des compositions denses sans fautes apparentes, selon les démonstrations relayées par TechCrunch.
Axios rapporte que les équipes d’OpenAI ont insisté sur la notion de conception « end-to-end » : rédiger un copywriting, l’analyser, puis produire une image qui l’intègre proprement, le tout dans une seule conversation.
Résolution 2K, huit images par run, ratios flexibles
Côté technique, GPT-Image-2 grimpe jusqu’à 2 048 pixels de résolution et peut générer jusqu’à huit images en une seule requête. Le modèle accepte des ratios allant de 3:1 à 1:3, ce qui ouvre la porte aux bannières ultra-larges comme aux formats portraits typiques des stories mobiles.
Interesting Engineering note aussi une vitesse d’exécution doublée par rapport au modèle précédent. Pas un détail, alors que créatifs et marketeurs utilisent de plus en plus ces outils pour produire des variations en série.
Le knowledge cutoff du modèle est fixé à décembre 2025, ce qui signifie que GPT-Image-2 maîtrise les styles visuels, les tendances et les références culturelles de cette période. Pratique pour des visuels sur l’actualité, la mode ou la pop culture récente.
Un mode « thinking » réservé aux abonnés payants
OpenAI introduit avec cette version un mode « thinking », qui intègre une étape de raisonnement avant la génération. L’IA réfléchit à la composition, planifie la mise en page et corrige les incohérences avant de livrer le résultat.
Ce mode est réservé aux abonnés payants (ChatGPT Plus, Team, Pro et Enterprise). La version standard reste accessible gratuitement à tous les comptes. Même logique côté Codex, le nouvel environnement de développement IA, qui récupère lui aussi l’accès à GPT-Image-2, dans la continuité de la mise à jour de GPT-4.1, le modèle codeur dévoilé la semaine passée.
L’API gpt-image-2 est également ouverte aux développeurs, avec une tarification calculée selon la qualité et la résolution des sorties. De quoi intéresser les agences et les éditeurs d’outils qui cherchent à brancher un moteur d’images dernière génération sur leurs propres plateformes.
Face à Midjourney, Imagen 4 et Firefly
Le timing n’est pas anodin. Midjourney, Imagen 4 de Google, Flux de Black Forest Labs et Adobe Firefly dominent aujourd’hui certaines niches du marché. Chacun a ses forces : Midjourney pour la créativité brute, Imagen 4 pour la cohérence photographique, Flux pour la vitesse, Firefly pour l’intégration dans la suite Adobe, qui vient d’ailleurs d’ajouter son propre assistant IA dans Creative Cloud.
Avec GPT-Image-2, OpenAI joue la carte de l’intégration conversationnelle : pas besoin d’ouvrir un autre outil, tout se fait dans ChatGPT, où l’utilisateur peut naviguer entre texte, analyse, code et image sans changer d’interface. Startup Fortune souligne que cette approche séduit particulièrement les PME qui cherchent un seul abonnement pour couvrir plusieurs usages. Le concurrent Anthropic vient d’ailleurs de riposter avec Claude Design, un outil qui vise le même public.
Une journée chargée pour OpenAI
La conférence du 21 avril ne s’est pas limitée à l’image. OpenAI a profité de l’événement pour déployer une mise à jour majeure de Codex, qui s’étend désormais au pilotage de navigateur, aux workflows web, à la mémoire persistante et à l’automatisation.
Le contexte économique est favorable. L’entreprise dirigée par Sam Altman affiche 2 milliards de dollars de revenus mensuels. La part entreprise dépasse 40 % du chiffre d’affaires et devrait rejoindre le consumer d’ici fin 2026. Une levée de 122 milliards de dollars a été annoncée pour financer la phase suivante, et une introduction en Bourse est en préparation. À côté, la récente sortie de GPT-5.4 Cyber pour la cybersécurité témoigne d’une stratégie d’élargissement méthodique.
Pour les utilisateurs, les changements sont immédiats. GPT-Image-2 remplace progressivement l’ancien modèle dans ChatGPT cette semaine, sans bascule manuelle. Les abonnés payants voient apparaître le mode thinking dans leur interface. Les développeurs qui attendaient une nouvelle brique image dans leurs applis, eux, ont de quoi reprogrammer leurs pipelines.











