Après une période marquée par des turbulences internes et une concurrence de plus en plus féroce, OpenAI repart à l’offensive en avril 2026. En attendant le modèle GPT-5.5 dont le lancement semble imminent, l’entreprise dévoile ChatGPT Images 2.0, un nouveau modèle natif pour générer des images. Selon OpenAI, il s’agit « du meilleur modèle sur le marché ».

Chaque semaine, plus d’un milliard d’images sont générées par les utilisateurs de ChatGPT. Des centaines de millions de personnes ont pris l’habitude d’utiliser le chatbot d’OpenAI pour illustrer des documents ou créer des images amusantes : ChatGPT ne sert plus seulement à répondre à des questions textuelles, il est devenu un moteur de création visuelle au quotidien.

Si OpenAI reconnaît s’être trompé avec Sora et la génération de vidéos, le géant de l’intelligence artificielle est convaincu que la génération de l’image est importante face à Google ou Anthropic, ses deux principaux concurrents. L’entreprise mise énormément sur cet aspect pour relancer une dynamique de croissance, alors que le service plafonne depuis la fin d’année.

Un peu plus d’un an après avoir lancé le premier GPT-Image, qui avait succédé à Dall-E en tant que modèle de génération d’images de référence, OpenAI dévoile ChatGPT Images 2.0. Le modèle, qui avait fuité ces derniers jours sous le nom de code « Duct Tape », remet ChatGPT dans la course. L’entreprise a présenté à Numerama « ChatGPT Images 2.0 » en avant-première et avance très confiante. Sur une des slides de la présentation, on pouvait même lire un message ironique : « il explose Nano Banana », en référence directe au dernier modèle de Google.

ChatGPT Images 2.0 est le meilleur modèle de génération d’images au monde, selon OpenAI

Avec ChatGPT Images 2.0, OpenAI ajoute une véritable couche de raisonnement à sa création visuelle. Un prompt n’est plus traité aveuglément : le modèle GPT derrière la création (probablement un prélude à GPT-5.5) planifie la composition et se pose des questions sur l’intention de l’utilisateur. Il peut notamment se souvenir de vos préférences personnelles et de vos créations précédentes pour garantir un bon résultat du premier coup.

Selon OpenAI, ChatGPT Images 2.0 surpasse Nano Banana 2 de Google sur à peu près tous les critères techniques (à l’exception de la résolution, limitée au 2K ici) :  

  • Rendu du texte : La génération de textes au sein des images est enfin maîtrisée. Le modèle comprend les requêtes typographiques complexes et intègre naturellement le texte, sans que les lettres ne bavent.
  • Nouveaux formats (du 3:1 au 1:3) : Le modèle gère avec aisance de nouveaux formats extrêmes. Il est capable de générer des images ultra-larges (3:1) idéales pour des bannières web, ou très verticales (1:3) pour des interfaces de smartphones ou des signets.
  • Intelligence multilingue : Historiquement très centré sur l’alphabet latin, le modèle comprend et génère désormais nativement du texte en japonais, coréen, chinois, hindi ou bengali de manière fluide.
  • Génération en lot : ChatGPT Images 2.0 peut générer jusqu’à 8 images simultanément avec un seul prompt. Le modèle conserve une mémoire parfaite et une stricte cohérence de personnage d’une image à l’autre (idéal pour faire un manga ou un storyboard).
  • Intégration poussée avec Codex : OpenAI vise les développeurs. Il est désormais possible de générer des brouillons d’interfaces (UI) complexes, de les comparer, puis de demander à Codex de les transformer en code fonctionnel, le tout sans quitter l’interface.
Image générée par ChatGPT Images 2.0.
Image générée par ChatGPT Images 2.0. // Source : OpenAI

Malgré ces promesses, OpenAI admet que son modèle n’est pas infaillible. ChatGPT Images 2.0 a encore beaucoup de mal avec les concepts nécessitant un modèle physique spatial parfait. Si vous lui demandez de générer un mode d’emploi d’origami étape par étape, de résoudre visuellement un Rubik’s Cube ou de gérer des textures microscopiques très denses (comme des grains de sable distincts), l’IA va trébucher. Les surfaces cachées ou reflétées posent également encore problème.

Ces deux images ont été créées avec ChatGPT. À chaque fois, il y a plusieurs images dans l'image.
Ces deux images ont été créées avec ChatGPT. À chaque fois, il y a plusieurs images dans l’image. // Source : OpenAI

Sur son site, OpenAI publie des dizaines d’exemples de contenus créés par ChatGPT Images 2.0.

Attention à la facture : il y a en réalité 3 modèles

Comme souvent avec OpenAI, les démos peuvent cacher une segmentation commerciale. L’entreprise met en avant la gratuité de son ChatGPT Images 2.0… mais les vraies capacités de réflexion sont réservées aux abonnements payants :

  • Version gratuite : Accès exclusif au mode « Instant », une version certes très rapide, mais dépourvue des capacités de raisonnement avancé.
  • ChatGPT Plus : Accès au fameux mode « Thinking ». L’IA prend son temps : elle fait des recherches sur le web, structure son idée, se corrige et génère des images complexes beaucoup plus abouties. Les professionnels accédant à l’API pourront utiliser le modèle baptisé gpt-image-2 capable de générer des visuels en qualité 2K.
  • ChatGPT Pro : Pour accéder à la meilleure version du modèle, il faut l’abonner à 100 ou 200 euros par mois.

Si OpenAI tient ses promesses, ChatGPT pourrait redevenir incontournable pour les créatifs. Mais sa fenêtre est étroite : Google pourrait très bien reprendre de l’avance en lançant Nano Banana 3.

Tous les regards se tournent désormais vers les prochains jours : les rumeurs suggèrent un lancement imminent de GPT-5.5. OpenAI va-t-il faire une semaine d’annonces ?

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !