C’est une commande très pratique que vient de sortir Midjourney. Avec son « Style Tuner », on peut visualiser en une seule fois plusieurs styles autour d’un même prompt. Idéal si vous manquez d’inspiration pour demander un rendu.

Quiconque a déjà utilisé Midjourney pour générer des dessins à la volée s’est rendu compte que trouver la bonne l’instruction (le « prompt ») à donner à l’intelligence artificielle générative est un exercice à part entière. Il faut non seulement décrire correctement et précisément son sujet, mais expliquer à l’IA dans quelle esthétique on souhaite le voir.

La conception d’un bon prompt est incontestablement la difficulté première de l’internaute voulant utiliser Midjourney. Un challenge qui peut être aujourd’hui atténué avec la sortie d’un nouvel outil sur la plateforme. Depuis le 2 novembre, une commande — le « tuner » — est proposée à celles et ceux qui paient un abonnement (l’accès gratuit a été suspendu ce printemps).

Avoir un aperçu d’un prompt avec des styles variés

Pour le dire simplement, le « Style Tuner » (« accordeur de style ») permet d’avoir un aperçu de plusieurs styles différents sur la base d’une même requête. Il suffit de taper sur Discord « /tune votre demande » pour demander à Midjourney de fournir plusieurs approches visuelles. Les rendus sont véritablement très divers, ce qui offre un large panel de choix pour l’internaute.

Selon Midjourney, l’outil permet de contrôler « la personnalité du modèle ». On peut ainsi influer sur les couleurs, le style et les détails de ce qui apparaît à l’image. Il s’agit aujourd’hui d’une première version de l’outil. Des explications détaillées de la prise en main sont données dans le canal officiel, ainsi que sur le web avec une documentation ad hoc.

Midjourney Style Tuner
Chaque style est proposé dans une vignette composée d’un carré de quatre cases. C’est assez facile à distinguer. // Source : Capture d’écran

Lorsque vous utilisez cette instruction (la nôtre était « /tune a bird flying »), vous récupérez ensuite un lien vers une page web qui vous montre les différents styles imaginés par Midjourney. Il faudra préalablement donner quelques réglages en plus, en particulier si vous voulez 16, 32, 64 ou 128 esthétiques différentes. Plus vous en demandez, plus cela sollicite les serveurs de Midjourney.

Dans le cas de notre demande, elle peut être consultée publiquement en suivant ce lien — nous avions demandé 32 visuels autour de notre oiseau qui vole. Il est ensuite possible de cliquer sur le visuel de son choix pour avoir ensuite un code. Quand vous l’utilisez ensuite dans Discord, vous indiquez à Midjourney que vous souhaitez travailler avec ce style.

réglage tune
Quelques réglages à faire en plus. // Source : Capture d’écran

Attention : le fonctionnement du code varie en fonction des images avec lesquelles vous interagissez. Dans le cas de nos 32 visuels, ils sont disposés sur 16 lignes, avec la possibilité de choisir, ou non, entre l’un et l’autre. Vous pouvez donc tout à fait combiner plusieurs styles. Cela transformera le code que vous pourrez utiliser ensuite sur Midjourney.

Par exemple, on peut choisir le style de gauche sur la ligne une, aucun sur les trois lignes suivantes, ensuite les deux de droite pour les deux lignes d’après et plus rien ensuite. Selon Midjourney, moins vous en sélectionnez, plus vous obtiendrez un style prononcé dans une direction. C’est ensuite une question de choix et de préférence.

L’outil fourni par Midjourney offre ainsi un bon moyen d’aider l’internaute à aller au-delà des réglages classiques de l’IA générative. C’est aussi un bon moyen d’orienter franchement la plateforme dans une direction, pour casser l’impression qui revient parfois que le style de Midjourney ne change jamais vraiment, malgré les prompts envoyés par l’internaute.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !