ChatGPT se met au dessin, grâce à DALL-E 3. OpenAI lance une nouvelle version de son IA générative spécialisée dans les images, concurrente de Midjourney. Envoyez vos requêtes à ChatGPT, qui va les transmettre à DALL-E 3, et faites les évoluer au fur et à mesure.

Midjourney n’a qu’à bien se tenir : l’un de ses principaux concurrents dans l’intelligence artificielle (IA) générative, DALL-E, est sur le point de recevoir une immense mise à jour. C’est ce qu’a annoncé Sam Altman, dans un message publié sur X (ex-Twitter) le 20 septembre 2023. Son déploiement n’est qu’une question de semaines, a-t-il ajouté.

DALL-E 3, c’est son nom, est actuellement accessible en avant-première à des fins de recherche, selon la page qui lui est consacrée. La mise à niveau doit être étendue à davantage d’internautes en octobre, via l’API d’OpenAI. Tout le monde n’y aura pas droit : il faudra posséder un abonnement à ChatGPT Plus (20 euros par mois) ou ChatGPT Entreprise.

DALL-E 3
Comparaison entre DALL-E 2 et DALL-E 3 sur la même requête. // Source : OpenAI

C’est là l’une des principales évolutions de DALL-E 3 : il a été conçu nativement sur ChatGPT, l’outil d’IA générative spécialisée dans le texte, et le principal succès d’OpenAI. En clair, on peut utiliser « ChatGPT comme partenaire de brainstorming », dixit OpenAI, pour affiner ses instructions (ou « prompts » dans le jargon) à envoyer à DALL-E 3.

« Lorsque vous soumettez une idée, note OpenAI, ChatGPT génère des prompts personnalisés et détaillés pour DALL-E 3, automatiquement, qui lui donnent vie. Si vous aimez une image particulière, mais qu’elle ne vous convient pas, vous pouvez demander à ChatGPT d’y apporter des modifications en quelques mots. »

On peut donc faire évoluer le dessin au fur et à mesure, puisque ChatGPT et DALL-E conservent le fil de la discussion à mesure que vous échangez avec ces systèmes d’IA. Pour illustrer le fonctionnement de ce nouveau DALL-E, Sam Altman a partagé une brève vidéo qui montre un internaute voulant créer une image à partir de la description de sa fille.

Sur la base d’une simple requête de quelques mots, ChatGPT retourne quatre images générées par DALL-E 3. L’internaute parvient ensuite à ajouter des détails à son visuel, à produire des designs particuliers (comme des stickers) et à puiser dans les explications de ChatGPT pour compléter l’instruction initiale. Tout cela, avec des images actualisées au fur et à mesure.

Au-delà du rapprochement entre ChatGPT et DALL-E, cette nouvelle mouture offre aussi des capacités accrues dans la compréhension et le traitement des images à générer sur requête des internautes. Une évolution somme toute nécessaire, car la concurrence progresse aussi : en attendant la v6, Midjourney a sorti en quelques mois sa v5, sa v5.1 et sa v5.2.

De son côté, la dernière grande évolution de DALL-E remonte à avril 2022, avec DALL-E 2 (dont la disponibilité a eu lieu en septembre de la même année). DALL-E, de son côté, a été lancé en janvier 2021. Depuis, DALL-E semblait moins être dans les priorités d’OpenAI : il faut dire que le lancement de ChatGPT, en novembre 2022, et son immense succès, a pas mal accaparé la société.

Des garde-fous pour ne pas plagier les artistes

Parallèlement aux évolutions techniques, OpenAI assure également avoir fait des efforts sur un plan plus juridique — en creux, l’entreprise prend des dispositions pour limiter son exposition à d’éventuelles poursuites judiciaires. En principe, DALL-E 3 n’est pas censé pouvoir générer de la violence, des contenus pour adultes ou de la haine.

Autre particularité de DALL-E 3 : il est impossible de générer des images en citant expressément un artiste vivant ou le style d’un artiste vivant — à supposer que DALL-E 3 ait connaissance de tous les artistes vivants, ce dont on peut douter. Mais, sur le principe, l’IA générative est censée refuser des requêtes qui consisteraient, en somme, à plagier les dessins d’autres artistes.

Dall-E Wall-E Dali
Le nom de DALL-E est l’association entre le peintre Dalí et le petit robot Wall-E. // Source : Dall-E

Il faut toutefois noter qu’OpenAI a prévu une procédure à travers laquelle les artistes pourront soumettre leurs propres œuvres, via un formulaire dédié. Il faudra probablement qu’OpenAI s’entraîne avec, mais cela sera pour la bonne cause : en apprenant quelles images il ne faut pas utiliser, OpenAI pourra orienter la formation de ses futures IA génératives.

Il reste maintenant à passer de la théorie à la pratique. On sait historiquement que les limites que mettent les entreprises concevant les IA génératives sont souvent challengées, parfois avec succès, par les internautes, qui parviennent à trouver des failles dans les requêtes. Ou, à trouver des cas de figure qui n’ont pas été pris en compte lors du calibrage de l’IA.

Reste une question : DALL-E 3 sera-t-il réservé pour toujours aux clients de ChatGPT Plus ou sera-t-il accessible à terme pour tout le monde ? Cela reste à voir. En faisant de ce nouvel outil une fonctionnalité exclusive de ChatGPT Plus, OpenAI se dote d’un atout séduisant qui pourrait amener à recruter davantage d’abonnés.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !