Une erreur dans le texte ?

C'est le bon endroit pour nous l'indiquer !
Attention, ce formulaire ne doit servir qu'à signaler une erreur. N'hésitez pas à utiliser la page de contact pour nous contacter ou nous faire part de vos suggestions. Merci.

Etape 1

Cliquez sur les paragraphes contenant des erreurs !

Midjourney ne sait pas faire les monocycles et les spaghettis

Les IA générant des images, comme Midjourney, sont de plus en plus puissantes, au point où elles arrivent parfois à berner les humains. Il existe encore cependant beaucoup de sujets qu'elles n'arrivent pas à reproduire.

Au premier abord, cela pourrait ressembler à des photos tout à fait normales de monocycle. Pourtant, lorsqu'on regarde de plus près, plusieurs anomalies sautent aux yeux : il n'y a pas toujours de pédales, ni de selle, et certains appareils sont complètement loufoques. C'est normal : les images ont été créées sur Midjourney par le journaliste anglais Luke Bailey.

https://twitter.com/imbadatlife/status/1639999348036493313

Sur Twitter, il explique s'être rendu compte que l'intelligence artificielle dédiée à la génération d'images éprouvait des difficultés à recréer certains objets, comme les monocycles. Et c'est une nouvelle importante pour détecter les fausses images qui pullulent de plus en plus sur le web.

Midjourney ne sait pas tout faire

Nous avons voulu reproduire l'expérience en demandant à Midjourney de créer des monocycles réalistes. Le résultat est, pour nous aussi, peu probant. Les pieds de certains cyclistes ne sont pas au bon endroit, et des monocycles comptent même deux roues, ce qui n'a rien à avoir avec le véhicule demandé. C'est un zéro pointé.

Les monocycles et Midjourney, ça fait deux. // Source : Midjourney

Ce n'est pas le seul engin que Midjourney rate. Des tests effectués par Numerama ont montré que l'intelligence artificielle peine également à modéliser des vélos, et ne sait toujours pas faire les lettres de l'alphabet (un problème que la précédente version de l'IA avait déjà). Elle ne sait pas non plus faire les appareils dentaires, ni les « grillz » (les dents en or de rappeurs, ndlr), ni les dinosaures, et elle est aussi en difficulté avec certains animaux et leurs squelettes.

Ce n'est pas joli-joli ces appareils dentaires. // Source : Midjourney

Enfin, Midjourney ne parvient pas à correctement présenter des gens qui mangent, que ce soit des burgers, du couscous, ou même boire un café. On vous laisse juger comment Emmanuel Macron ingère des spaghettis.

Difficile de manger des pâtes. // Source : Midjourney

Au début du mois de mars 2023, la version 5 de Midjourney nous bluffait en arrivant enfin à faire des mains réalistesAlors que les précédentes versions de l'IA ne parvenaient jamais à faire des doigts normaux, celle-ci les réalise beaucoup mieux. Aujourd'hui, les créations de Midjourney sont impressionnantes de réalisme, au point où il est désormais facile de se laisser berner par une fausse photo — comme avec celle du Pape en doudoune.

https://www.tiktok.com/@numerama/video/7215480278234500357

Cela étant, Midjourney a toujours de grosses lacunes. Le fait qu'elle ne sache pas bien faire les monocycles ne réglera cependant pas le problème des fake news générées par IA — il n'y a pas souvent de monocycles dans les photos. Et surtout, peut-être que la version 6 de Midjourney parviendra à faire correctement des spaghettis.

Une piste peut expliquer les faiblesses de Midjourney : le manque de données. L’IA est entraînée sur un vaste corpus d’images. L’IA sait donc particulièrement bien reconnaître et recréer ce qui apparaît très fréquemment en photo : des paysages, des humains, des animaux de compagnie, etc. Les mains sont plus rarement la cible d’une image ; c’est généralement le visage des personnes prises en photos. Cela explique le temps qu'a mis Midjourney pour se mettre au niveau. 

Pour le reste, c’est la même chose : les clichés de monocycles sont moins courants que ceux montrant des voitures. Idem pour les dinosaures par rapport aux chats, et ainsi de suite. L'enjeu des données « en entrée », pour nourrir les systèmes d'IA, reste clé.

https://www.youtube.com/watch?v=cmjEQ917V3c