Mardi 26 août, Google officialise un gros bond pour l’édition d’images : Gemini va pouvoir modifier n’importe quelle photo à partir d’un prompt.
Derrière ce progrès, un nouveau modèle signé DeepMind — surnommé en interne « nano-banana » — qui combine génération et retouche dans une seule et même interface. L’idée : vous chargez une ou plusieurs photos, vous décrivez à l’écrit ce que vous voulez changer et Gemini s’exécute tout en préservant fidèlement l’apparence des personnes (visages, style, etc.). Les tests de benchmarks sont unanimes : nano-banana est le nouveau meilleur modèle de retouche.


Des retouches pilotées à l’écrit qui ne déforment pas les visages
Le nouveau modèle de génération d’images de Google n’appartient pas à la famille « Imagen », comme les précédents modèles de génération d’images de Google. Il prend le nom « Gemini 2.5 Flash Image » et s’inscrit totalement dans l’application Gemini, en plus du Google AI Studio. Google indique à Numerama qu’Imagen va continuer à exister, mais que Gemini sait désormais générer nativement des images. Une approche semblable à celle d’OpenAI qui, avec GPT-4o-image, avait fait de la concurrence à Dall-e. (À noter qu’il y avait eu Gemini 2.0 Flash Image, mais qu’il était beaucoup moins performant).

Avec Gemini 2.5 Flash Image, la génération d’images fait sa révolution. On peut envoyer une photo de son salon à l’outil, puis lui demander d’ajouter des meubles et de changer la peinture. Gemini permet aussi de tester une nouvelle coupe de cheveux, de changer une émotion ou de fusionner des images.
Google met en avant la possibilité d’enchaîner plusieurs modifications sans repartir de zéro : Gemini se souvient de sa dernière génération et ne va pas détériorer la qualité à chaque prompt. Google insiste aussi sur la cohérence des visages : le mode est conçu pour ne pas vous remplacer par quelqu’un qui vous ressemble.
Plusieurs modes coexistent dans Gemini. On peut mélanger jusqu’à trois photos pour créer une scène commune, remplacer arrière-plan, changer le style d’une image, restaurer une image de mauvaise qualité, changer de tenue… Gemini est conçu pour offrir des résultats de qualité Photoshop, mais sans que l’utilisateur ait besoin de maîtriser quoi que ce soit. Il lui suffit de parler. En contrepartie : il y a une indication « AI » en bas de l’image ainsi qu’une signature SynthID invisible à l’œil.
Google veut faire mal à Photoshop : l’outil est disponible gratuitement dans Gemini
Dès aujourd’hui, et à échelle mondiale, Google déploie son nouvel éditeur d’images. L’entreprise indique que ses abonnés payants et ses utilisateurs gratuits y ont droit, ce qui semble indiquer un système de quotas pour préserver l’intégrité des serveurs. L’entreprise met également en avant la possibilité de transformer n’importe quelle photo en une courte vidéo, ce qui ne risque pas de faire les affaires d’Elon Musk, qui mise sur une proposition similaire avec Grok Imagine.
Avec Gemini 2.5 Flash Image, Google espère redevenir la destination de référence pour les personnes qui souhaitent créer des images. ChatGPT a eu son moment de gloire au printemps : Google espère désormais le sien. L’entreprise prévoit d’autres annonces sur l’IA cette semaine, comme l’arrivée des résumés vidéo de NotebookLM en français.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !