En deux jours, plus de 200 000 personnes ont déjà vu le dernier clip de Bigflo & Oli sur YouTube. Les rappeurs ont fait le choix d’utiliser l’intelligence artificielle Stable Diffusion pour générer une dizaine de milliers d’images qui illustrent leurs paroles. Numerama a interviewé son réalisateur.

« Ça va beaucoup trop vite ! ». Dans un morceau paru en 2022, Bigflo & Oli racontent l’histoire de l’univers. Le Big Bang, l’apparition de la Terre, les premiers êtres vivants, les humains, la société, la guerre… Comme le titre du morceau le dit si bien, tout va « beaucoup trop vite ».

Pour illustrer ce morceau, les rappeurs ont eu l’idée d’utiliser l’intelligence artificielle générative qui, d’une certaine manière, illustre parfaitement ce qu’ils racontent. ChatGPT n’existait pas au moment de la sortie du titre, il est aujourd’hui dans toutes les têtes. C’est Neb, un réalisateur spécialisé dans l’IA, qui s’est occupé de ce projet ambitieux, publié sur YouTube le 24 mars 2024.

Quelle démarche se cache derrière ce clip réalisé avec une intelligence artificielle ? Une telle production est-elle aussi simple que ce que certains prétendent ? Numerama a discuté avec le réalisateur du clip de Bigflo & Oli, pour comprendre ce qui se cache derrière cette production d’un nouveau genre.

Un clip réalisé entre 2022 et 2023

Passionné de musique depuis qu’il est enfant, Neb (qui préfère rester sous pseudo) a découvert les nouvelles possibilités de l’intelligence artificielle en 2021, à l’époque avec l’outil Disco Diffusion. Pour la première fois, il lui était possible de générer des images à partir de mots, ce qui lui a donné envie d’expérimenter de nouveaux concepts artistiques.

Exemple d'image dans le clip.
Exemple d’image dans le clip. // Source : Capture YouTube

Rapidement, les outils ont évolué. Neb a rapidement adopté Stable Diffusion, un des principaux concurrents de Midjourney et de Dall-e aujourd’hui. Il s’est amusé à créer des fanclips sur les réseaux sociaux (des clips non officiels), en illustrant les paroles de ses morceaux préférés avec l’IA. C’est comme ça qu’il s’est créé une notoriété, ce qui a incité des artistes à le contacter pour travailler avec lui.

En 2022, Neb entre en contact avec le duo de rappeurs pour la première fois. « Oli m’a envoyé un message pour dire qu’il appréciait le truc. Ironiquement, au moment où il m’a envoyé le message, j’étais justement en train de faire une animation sur un de leurs morceaux » confie-t-il amusé.

Le premier projet officiel de Neb était avec DJ Pone, sur le morceau Paradis.
Le premier projet officiel de Neb était avec DJ Pone, sur le morceau Paradis. // Source : YouTube

Ensemble, Neb, Bigflo et Oli choisissent d’opter pour le morceau Ça va beaucoup trop vite, puisque « les paroles s’y prêtent bien ». Le projet débute en octobre 2022 et s’achève en janvier 2023, avec la génération de milliers d’images et la création d’un clip vidéo. En mars 2024, une semaine avant la publication du clip, Bigflo & Oli lui annoncent que sa sortie est imminente. Une bonne surprise pour l’artiste, qui ne savait pas si le projet allait être publié un jour sur la chaîne YouTube des rappeurs.

Il est faux de dire qu’« aucun être humain n’a participé au clip »

Au début du clip de Bigflo & Oli, il est écrit que 49 225 images ont été générées par une intelligence artificielle et « qu’aucun être humain n’a participé à la création de celles-ci ». Une précision importante, alors que Bigflo & Oli se sont assurés d’inclure dans le titre de la vidéo la mention « Clip IA ».

Cela dit, est-ce vrai ? Neb explique à Numerama qu’il y a « un immense travail humain derrière ce clip », puisqu’il a passé plus d’une centaine d’heures à le réaliser. « À aucun moment ce ne sont les paroles qui sont promptées. Mon travail, c’est d’imaginer ce qui représenterait les paroles en image. C’est un vrai travail d’imagination et d’écriture. » explique le créateur.

Impressionnant, hein ? En réalité, un humain a grandement participé à la création du clip.
Impressionnant, hein ? En réalité, un humain a grandement participé à la création du clip. // Source : Capture YouTube

Au risque d’en décevoir quelques-uns, un clip comme celui de Bigflo & Oli ne se génère pas en quelques minutes. Il ne suffit pas de copier-coller les paroles dans le logiciel pour obtenir une vidéo de 4 minute et 6 secondes. Neb a dû imaginer le clip avec son imagination, écrire une phrase pour chaque image (ce qu’on appelle un prompt), puis réalisé un montage vidéo avec le logiciel DaVinci. D’ailleurs, sur les 49 225 images générées par Stable Diffusion, environ 12 000 ont été conservées dans le montage final, que Neb a assemblé pendant de longues heures.

L’IA dans la réalisation, un futur inévitable ?

Pour beaucoup, utiliser une IA pour réaliser un clip relève de la fainéantise. Beaucoup associent l’intelligence artificielle générative à l’automatisation, sans avoir en tête le processus artistique qui se cache derrière. Si l’on peut débattre du caractère artistique des images générées, comment remettre en question le travail d’imagination et de montage d’un réalisateur qui utilise l’IA comme un outil plutôt que comme un coréalisateur ?

Cette image apparaît au moment où les rappeurs disent « Dans tous les cas l'humanité a tout bouclé ». Mais quel était le vrai prompt ?
Cette image apparaît au moment où les rappeurs disent « Dans tous les cas l’humanité a tout bouclé ». Mais quel était le vrai prompt ? // Source : Capture YouTube

« Quand j’ai réalisé mon premier clip, il y avait beaucoup de peur liée à l’arrivée de cette nouvelle technologie, il y en a toujours d’ailleurs » analyse Neb. DJ Pone, le premier artiste à lui avoir fait confiance, lui confiait alors « retrouver dans le peur sur l’IA ce qu’il avait vécu avec la musique électronique ».

Pour Neb, une initiative comme celle de Bigflo & Oli est plutôt positive. « Il y a des artistes qui ont saisi ce débat de fond et qui essayent d’accompagner le public ». Il n’y voit toutefois pas de guerre entre l’IA et la réalisation classique : « c’est une nouvelle proposition artistique ».

« Tous les jours, il y a un nouvel outil, une nouvelle fonctionnalité qui débarque ». Neb fait notamment référence à Sora, le logiciel d’OpenAI qui génère des vidéos réalistes. « Ça me fait à la fois peur et à la fois rêver. Je savais que ça allait arriver, mais je ne pensais pas aussi rapidement. Je pense qu’on va avoir de nouveaux réalisateurs qui vont créer des trucs géniaux ».

Capture d'écran du futur clip de Neb, pour l'artiste Lass.
Capture d’écran du futur clip de Neb, pour l’artiste Lass. // Source : Neb, pour Numerama

En avril, Neb publiera un nouveau projet avec l’artiste Lass, qui lui a confié la réalisation du clip du morceau Passeport. Un moyen de voir les progrès réalisés par Stable Diffusion, puisque le clip de Bigflo & Oli utilise une ancienne version du logiciel.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !