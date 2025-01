Lecture Zen Résumer l'article

De simples clichés, pris soi-disant « sur le vif » avec un iPhone, ont récemment semé le doute sur la capacité à détecter l’IA dans nos fils d’actualité. Pourtant, ce n’est pas qu’une banale génération sur un outil grand public.

En ce début d’année 2025, les photos de cette jeune femme ont fait le tour des réseaux sociaux, présentées comme la preuve ultime que la création par IA générative est désormais indétectable pour le commun des mortels. Et on ne peut que le reconnaître à la vue des clichés : ils sont bluffants.

Le cocktail employé par dal_mac sur Reddit est ce qui fonctionne le mieux pour tromper les gens, à savoir des photos classiques, peu artistiques, qui auraient pu être prises par n’importe qui. Elles ne sont pas très belles, pas très bien cadrées et leur côté photo prise sur le vif donnent un air de déjà-vu à toute la série. Tout le monde s’est déjà pris ou fait prendre en photo, en randonnée, devant une belle bâtisse en pierre.

La touche finale est donnée par un style qui est le plus trompeur en matière d’image générée par IA : la photo « iPhone ». Notre œil est habitué à reconnaître le grain, les contrastes et même les défauts des photos prises par les smartphones d’Apple, tant elles inondent les réseaux sociaux. Même au-delà d’Apple, rendre réaliste une photo « prise par un smartphone » est chose plus aisée que simuler le gagnant d’un prix Hasselblad : on sait reconnaître ce style mainstream, dont on doute peu.

La même jeune femme au resto Encore la même en balade

La jeune femme existe, tout le reste est généré

Mais cette affaire cache une autre histoire, un peu plus technique, qui montre surtout que la compréhension des possibilités de l’IA n’est pas encore parfaitement maîtrisée par toutes et tous : oui, la jeune femme sur ces clichés existe. Elle n’a pas été générée par une IA. Il ne s’agit pas d’un prompt tapé avec beaucoup de succès sur Midjourney, ChatGPT ou Grok, mais d’une utilisation fine de Flux, un outil d’IA générative qui peut être exécuté en local et qui a la particularité de donner suffisamment de contrôle à l’utilisateur pour obtenir des résultats cohérents sur plusieurs générations.

Ainsi, l’auteur de la série explique avoir « poussé les limites de Flux » en appliquant successivement deux modèles entraînés sur la génération de ce visage et sur le style de photos prises avec un iPhone. En combinant ces deux modèles restreints à un plus grand modèle de génération, il parvient à ce résultat, qu’il continue de travailler afin de le rendre plus réaliste encore. Comment le modèle utilisé a réussi à créer et maintenir une cohérence sur ce visage féminin ? Eh bien tout simplement parce que la personne sur les photos existe : le sous-modèle « visage » a été entraîné avec 20 photos bien réelles d’une personne bien réelle.

L’explication de l’auteur derrière la série de clichés // Source : Capture d’écran Numerama

Une expérience dans l’émission Unlock

Ce sujet de la vraisemblance des créations générées avec des IA a été abordé par Numerama et Frandroid dans l’émission Unlock. Pour la séquence, Robin, vidéaste pour Frandroid, avait préparé des images vraies et fausses et a mis au défi le plateau et le public de déceler laquelle était laquelle. Les images générées par IA étaient des déclinaisons de véritables images, modifiées entre 40 et 60 % par un modèle exécuté en local — plus ou moins la même technique que celle utilisée pour la « la femme qui n’existe pas ».

Nous avons été bluffés par ce que nous avons vu et nous n’avons clairement pas eu la bonne réponse à chaque fois — les spectateurs non plus. Vous pouvez revoir la séquence dans l’extrait vidéo ci-dessous et jouer au jeu en même temps que nous.

Est-ce qu’il s’agit de vraies photos ? Vous le saurez en regardant la séquence d’Unlock ! // Source : Robin Wycke

