DALL-E, le générateur d’images d’OpenAI, permet désormais de modifier partiellement une image, pour affiner une création assistée par intelligence artificielle. Une avancée majeure pour les modifications artistiques.

Dans un futur relativement proche, un outil complexe comme Photoshop sera-t-il obsolète ? La montée de l’intelligence artificielle générative rend cette piste crédible, alors que la création et la modification d’une image n’ont jamais semblé aussi accessibles. Les outils comme Photoshop conservent une finesse créative, puisqu’ils permettent d’imposer plus facilement une vision, mais les IA génératives fabriquent du contenu souvent plus que satisfaisant, en seulement quelques secondes.

Le 3 avril 2024, OpenAI a annoncé le lancement d’un outil d’édition d’image, qu’il intègre directement à ChatGPT et à Dall-E. Comment ça marche ?

Un pinceau pour sélectionner un endroit à modifier

Soyons clairs, le nouvel outil de modification d’image d’OpenAI est infiniment moins complet que Photoshop. Là où Adobe propose une centaine d’outils, ChatGPT en propose… un seul.

On génère une image avec une phrase (« Génère une image d’une personne dans la rue à New York, en train de marcher à Time Square. Il a un t-shirt bleu et une casquette » par exemple), puis on l’ouvre en plein écran. Un pinceau permet d’accéder à l’éditeur, puis d’entourer une zone à modifier.

Ce petit logo permet de modifier une image.
Ce petit logo permet de modifier une image. // Source : Numerama

Contrairement à Photoshop, Pixelmator ou Affinity, ChatGPT ne permet pas à l’utilisateur de modifier lui-même l’image.

Quand on entoure une zone, il faut écrire un nouveau prompt. On peut notamment entourer le t-shirt et demander à le remplacer par un costume, l’IA conserve alors l’image originale, mais change la partie entourée.

Les différentes versions apparaissent à droite.
Les différentes versions apparaissent à droite. // Source : Numerama

Avant qu’OpenAI ne déploie ce changement, chaque nouvelle phrase obligeait Dall-E à régénérer une image à partir de rien, ce qui empêchait tout développement d’un projet (à prendre ou à laisser). Le nouvel outil rend la création d’une idée sur mesure possible, même s’il nécessite toujours de faire confiance à la machine.

Impossible d’importer une image de sa photothèque

Capture d’écran 2024-04-04 à 11.53.10

Autre limite : le générateur d’OpenAI ne peut modifier que des images générées par Dall-E. L’importation d’une photo ne mène à rien, il est impossible d’entourer le ciel et de demander un changement. C’est dommage, puisque cela pourrait donner un nouvel élan à ChatGPT, en le transformant en un vrai outil de retouche.

Comment expliquer cette limitation ? OpenAI est sans doute prudent, mais pourrait débloquer cette possibilité dans le futur. Rien ne l’empêche techniquement, d’autant plus que ChatGPT prétend en être capable. Mais quand on lui demande d’effectuer une modification, il génère une image qui ressemble à celle que l’on a importée, mais qui est complètement artificielle.

Du côté d’Adobe, le créateur de Photoshop intègre dans ses logiciels Firefly, sa propre IA générative. Firefly peut générer du contenu ou modifier un élément de l’image à partir d’une phrase, comme Dall-E. Mais Firefly peut aussi retoucher les vraies photos, ce qui laisse pour l’instant une vraie avance à Adobe. Pour combien de temps ?


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.