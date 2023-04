Une nouvelle commande (« prompt ») arrive dans Midjourney. Elle permet de décrire une image. Quatre propositions sont formulées pour chaque photo envoyée. Ensuite, il est possible de créer des variantes sur le cliché.

Il y a du changement dans Midjourney depuis le 4 avril 2023. Le laboratoire derrière cette intelligence artificielle spécialisée dans la production d’images a envoyé une mise à jour de son système qui intéressera celles et ceux qui l’utilisent. Midjourney parvient désormais à décrire une image qu’on lui envoie. Tout du moins, il s’efforce de l’analyser correctement.

Décrire une image avec Midjourney

Pour cela, Midjourney a ajouté une nouvelle commande (un « prompt ») que l’on peut utiliser à tout moment. Tapez seulement « /describe » (sans les guillemets) dans le champ de saisie sur Discord. Cela fera apparaître un bouton d’action à travers lequel vous allez pouvoir retrouver votre image sur votre ordinateur — si c’est une image qui est sur le web, il vous faudra la télécharger d’abord.

Tapez « /describe », cherchez votre image et envoyez le tout à Midjourney, qui s’occupera du reste. // Source : Capture d’écran

Une fois votre image envoyée, Midjourney affichera quatre propositions pour décrire le visuel. Pourquoi quatre ? Parce que l’intelligence artificielle peut ne pas tomber juste en analysant le cliché. Alors, elle propose quatre variantes en remplaçant quelques passages à chaque fois — que ce soit sur le sujet, le style ou la technique de la photo.

Dans l’exemple de ce panda roux, imaginé par DALL-E, une IA générative concurrente, les quatre descriptions proposées étaient :

a red panda with stars in the sky, flying in the sky, in the style of dark magenta and light blue, playful, dreamlike imagery ;

the red panda flying in space with stars, in the style of gabriel bá, cryptopunk, brushwork mastery, wlop, oshare kei, ferrania p30, anna dittmann ;

red panda flying in the starry sky, in the style of gabriel bá, cryptopunk, sakimichan, dark magenta and light blue, robert munsch, brushwork mastery, ferrania p30 ;

red panda flying through the night sky in the middle of a galaxy, in the style of brushwork mastery, comic art, caninecore, wimmelbilde.

Créer des variantes d’image sur Midjourney avec les prompts suggérés

Vous avez ensuite la possibilité de cliquer sur la description qui vous semble la plus pertinente. Midjourney fera apparaître une fenêtre surgissante dans laquelle il vous proposera, si vous le désirez, de modifier le prompt ou de rajouter des instructions. À toute fin utile, le système vous invite à vous assurer de ne pas transmettre de mots de passe ou de données personnelles.

Une mise en garde partagée par Midjourney. C’est aussi ici que vous pouvez ajouter des instructions au prompt. // Source : Capture d’écran

Une fois la commande envoyée, Midjourney s’efforce de recréer des images (quatre, là encore) correspondant aux paramètres que vous lui avez envoyés.

Les dernières étapes sont celles que vous connaissez déjà si vous avez l’habitude de Midjourney : vous pouvez générer quatre autres visuels (si aucun ne vous plait dans la liste). Midjourney vous propose aussi d’en sélectionner une et pour la décliner en quatre variantes. Enfin, si une vous tape dans l’œil, vous avez aussi l’option de la produire en haute qualité.

Voilà les quatre pistes proposées par Midjourney. Le style peut être assez différent de l’image initiale. // Source : Numerama avec Midjourney

Des descriptions plus ou moins heureuses

Nous avons fait l’expérience à trois reprises avec la commande pour voir de quelle façon Midjourney s’en sortait. Les photos utilisées ici étaient dans le domaine public pour la première et libre de droits pour la seconde. Elle montre Charlie Chaplin en 1914, dans le film Charlot est content de lui. L’autre met en scène une fusée Falcon 9 de SpaceX sur son pas de tir.

Voici les descriptions suggérées par Midjourney et les illustrations générées selon nos choix, sans les retoucher.

La reconnaissance d’image n’est pas encore à toute épreuve. // Source : Capture d’écran

Dans cette description, Midjourney a eu quelques difficultés à interpérer l’image, en évoquant tantôt un cheval, tantôt un lion. Il a aussi dit que Charlie Chaplin était ici tourné vers les enfants — ce qui est inexact. Il a néanmoins vu Charlie Chaplin et la foule. On a choisi la première photo, mais Charlie Chaplin a disparu dans les quatre visuels proposés.

Où est Charlie ? // Source : Capture d’écran

Une Falcon 4, vraiment ? Pour le reste, l’analyse est plutôt bonne. // Source : Capture d’écran

Dans cet autre exemple, Midjourney s’en est mieux tiré. Il a évoqué SpaceX et une fusée dans ses prompts (même s’il a parlé curieusement d’une Falcon…4, alors que c’est la 9). Les couleurs ont été bien identifiées et l’ambiance crépusculaire aussi. La dernière photo est celle qui diverge le plus, avec une deuxième fusée à l’écran. Les lanceurs ont des profils très variés.

On a l’ambiance crépusculaire, mais on cherche toujours la Falcon 9. Cela dit, au moins a des fusées sur leur pas de tir. // Source : Numerama avec Midjourney

Il est important de noter que les images utilisées dans cette démonstration ne sont plus ou pas couvertes par des règles contraignantes sur le droit d’auteur. Si vous utilisez Midjourney, assurez-vous que vous avez bien le droit de vous servir de ces images dans une IA — des artistes, en effet, s’y opposent.

