Les dimensions des photos que génère Midjourney sont petites. De nouvelles options d’agrandissement sont toutefois arrivées. Elles permettent de passer une image de l’IA générative dans un format bien plus large.

Trop petites, les photos que génère Midjourney ? Plus maintenant. Une option vient de voir le jour parmi les commandes du service, afin de récupérer des images dans un format agrandi. C’est ce qu’on peut lire dans l’annonce du jour de David Holz, le fondateur de l’IA générative spécialisée dans le dessin. Il a partagé la nouvelle le 19 octobre sur son serveur Discord.

« Nous sortons deux nouveaux upscalers aujourd’hui, un upscaler 2x et un upscaler 4x », déclare l’intéressé. Les nouveaux paramètres sont visibles directement sur la v5 de Midjourney ou sur Niji (la version « manga » de Midjourney), sous n’importe quelle image. Les options sont visibles une fois que l’internaute choisit une image parmi les quatre proposées par l’outil.

« L’upscaler est subtil et tente de garder les détails aussi proches que possible de l’image originale, mais ne peut pas corriger les défauts ou les problèmes d’une ancienne image », prévient-il. Il est possible de se servir de ces options sur des photos déjà générées, en utilisant une commande particulière « /show job_id » et l’identifiant de l’image en question.

upscale
Deux nouveaux paramètres sont visibles sur la première image : Upscale (2x) et Upscale (4x). Le résultat est donné en dessous. // Source : Capture d’écran

La fonctionnalité étant récente, David Holz prévient qu’il y a encore des petits bugs à résoudre : dans de très rares cas, une image noire ou corrompue peut apparaître en faisant un upscale 4x. Certaines images agrandies peuvent aussi être légèrement assombries durant le processus. Les images floues de base ne sont pas rendues plus nettes en montant en taille.

La veille du lancement, l’intéressé sondait encore sa communauté à ce sujet, en demandant laquelle de ces deux options (une permettant d’agrandir à 2 048 pixels de large, l’autre à 4 096 pixels) aurait sa préférence. En somme, le choix résidait entre une image d’une définition en « 2k » (définition de 2 048×1 080 pixels) et une autre d’une définition en « 4k » (4 096×2 160 pixels).

Une option réclamée depuis des mois

Les dimensions insuffisantes des visuels générés par Midjourney constituaient un motif d’insatisfaction de longue date parmi les membres du service. En mai, Grudd s’agaçait de l’absence d’une option débouchant sur une image de plus grande taille. « Je suis très frustré par le problème de résolution sur votre plateforme », s’agaçait-il, pointant aussi un manque de réponse de Midjourney.

L’internaute, très mécontent, rejetait également la perspective de faire un traitement d’image post-génération, en l’agrandissant avec Photoshop, par exemple. « C’est un pansement, pas une solution. J’ai besoin d’un point de départ en haute résolution », réclamait-il. Un agacement qui avait fini par atteindre son but, puisque David Holz lui avait répondu dans la journée.

sondage upscale
David Holz sonde la communauté. // Source : Capture d’écran

À l’époque, le fondateur de Midjourney suggérait une évolution de cette nature avec la version 6 de son IA générative, qui n’est pas sortie à ce jour — actuellement, on en est à la v5.2, sortie en juin 2023. « Nous essayons d’améliorer la résolution de la v6 et éventuellement l’upscaling, mais l’équipe est un peu sous l’eau en ce moment », confiait-il au cours du printemps.

Par le passé, il a existé des options d’upscaling dans les anciens modèles de l’outil génératif, comme on peut le lire dans la documentation de Midjourney. Sur Discord, David Holz indiquait en février qu’elles étaient en train d’être déconsidérées : « Il s’agit plutôt d’une fonctionnalité héritée, qui n’est pas recommandée pour la v4 et qui ne sera pas disponible pour la v5. »

De base, la version 5 de Midjourney génère des images de 1 024 pixels de côté. En version 4, qui avait accès à un upscaler, c’était 512 pixels de côté. La hauteur et la largeur peuvent varier selon le ratio choisi : une image en 16/9e aura une largeur de 1 456 pixels sur 816 pixels de haut. La version 5 a une option pour ajouter du décor via un dézoom, mais cela se fait dans les dimensions de base.

« Il y a souvent un décalage entre les demandes et les fonctionnalités »

David Holz

Depuis, le sujet est revenu épisodiquement. David Holz avait cherché aussi à calmer les attentes de sa communauté : « Malheureusement, il y a souvent un décalage entre les demandes et les fonctionnalités ». Celui-ci prend ‘ailleurs régulièrement le pouls de sa communauté (via des sondages) sur divers sujets, mais aussi sur les fonctionnalités qui ont davantage sa faveur.

Finalement, il n’aura pas été nécessaire d’attendre ni la v6 de Midjourney ni la v5.3. Les indices s’accumulaient pour un lancement bien avant. C’est ce que relevait la consultante Alie Jules, qui suit de très près les développements chez Midjourney. Elle notait le 27 septembre qu’un upscaler est bien sur les rails, pour une définition de 2 000 par 2 000 pixels (2k par 2k, en somme).

Il y avait toutefois une incertitude sur la date de de déploiement (on pensait aussi que la fonction allait être livrée avec Midjourney v5.3). C’est donc par surprise que le lancement a eu lieu, le 19 octobre. Alie Jules anticipait une sortie autour du 13 ou du 15 octobre. C’était presque bon, à une petite semaine près.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !