Il y a du changement dans Midjourney depuis le 4 avril 2023. Le laboratoire derrière cette intelligence artificielle spécialisée dans la production d’images a envoyé une mise à jour de son système qui intéressera celles et ceux qui l’utilisent. Midjourney parvient désormais à décrire une image qu’on lui envoie. Tout du moins, il s’efforce de l’analyser correctement.
Décrire une image avec Midjourney
Pour cela, Midjourney a ajouté une nouvelle commande (un « prompt ») que l’on peut utiliser à tout moment. Tapez seulement « /describe » (sans les guillemets) dans le champ de saisie sur Discord. Cela fera apparaître un bouton d’action à travers lequel vous allez pouvoir retrouver votre image sur votre ordinateur — si c’est une image qui est sur le web, il vous faudra la télécharger d’abord.
Une fois votre image envoyée, Midjourney affichera quatre propositions pour décrire le visuel. Pourquoi quatre ? Parce que l’intelligence artificielle peut ne pas tomber juste en analysant le cliché. Alors, elle propose quatre variantes en remplaçant quelques passages à chaque fois — que ce soit sur le sujet, le style ou la technique de la photo.
Dans l’exemple de ce panda roux, imaginé par DALL-E, une IA générative concurrente, les quatre descriptions proposées étaient :
- a red panda with stars in the sky, flying in the sky, in the style of dark magenta and light blue, playful, dreamlike imagery ;
- the red panda flying in space with stars, in the style of gabriel bá, cryptopunk, brushwork mastery, wlop, oshare kei, ferrania p30, anna dittmann ;
- red panda flying in the starry sky, in the style of gabriel bá, cryptopunk, sakimichan, dark magenta and light blue, robert munsch, brushwork mastery, ferrania p30 ;
- red panda flying through the night sky in the middle of a galaxy, in the style of brushwork mastery, comic art, caninecore, wimmelbilde.
Créer des variantes d’image sur Midjourney avec les prompts suggérés
Vous avez ensuite la possibilité de cliquer sur la description qui vous semble la plus pertinente. Midjourney fera apparaître une fenêtre surgissante dans laquelle il vous proposera, si vous le désirez, de modifier le prompt ou de rajouter des instructions. À toute fin utile, le système vous invite à vous assurer de ne pas transmettre de mots de passe ou de données personnelles.
Une fois la commande envoyée, Midjourney s’efforce de recréer des images (quatre, là encore) correspondant aux paramètres que vous lui avez envoyés.
Les dernières étapes sont celles que vous connaissez déjà si vous avez l’habitude de Midjourney : vous pouvez générer quatre autres visuels (si aucun ne vous plait dans la liste). Midjourney vous propose aussi d’en sélectionner une et pour la décliner en quatre variantes. Enfin, si une vous tape dans l’œil, vous avez aussi l’option de la produire en haute qualité.
Des descriptions plus ou moins heureuses
Nous avons fait l’expérience à trois reprises avec la commande pour voir de quelle façon Midjourney s’en sortait. Les photos utilisées ici étaient dans le domaine public pour la première et libre de droits pour la seconde. Elle montre Charlie Chaplin en 1914, dans le film Charlot est content de lui. L’autre met en scène une fusée Falcon 9 de SpaceX sur son pas de tir.
Voici les descriptions suggérées par Midjourney et les illustrations générées selon nos choix, sans les retoucher.
Dans cette description, Midjourney a eu quelques difficultés à interpérer l’image, en évoquant tantôt un cheval, tantôt un lion. Il a aussi dit que Charlie Chaplin était ici tourné vers les enfants — ce qui est inexact. Il a néanmoins vu Charlie Chaplin et la foule. On a choisi la première photo, mais Charlie Chaplin a disparu dans les quatre visuels proposés.
Dans cet autre exemple, Midjourney s’en est mieux tiré. Il a évoqué SpaceX et une fusée dans ses prompts (même s’il a parlé curieusement d’une Falcon…4, alors que c’est la 9). Les couleurs ont été bien identifiées et l’ambiance crépusculaire aussi. La dernière photo est celle qui diverge le plus, avec une deuxième fusée à l’écran. Les lanceurs ont des profils très variés.
Il est important de noter que les images utilisées dans cette démonstration ne sont plus ou pas couvertes par des règles contraignantes sur le droit d’auteur. Si vous utilisez Midjourney, assurez-vous que vous avez bien le droit de vous servir de ces images dans une IA — des artistes, en effet, s’y opposent.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !