Disponible en test dans le « Google Labs », l’intelligence artificielle MusicLM est capable de générer une musique grâce à des prompts similaires à ceux de ChatGPT. Le résultat est intéressant, bien qu’encore limité.

Dans le futur, un compositeur pourra-t-il parler à son ordinateur pour corriger quelque chose qui le dérange dans un morceau ? Avec son projet MusicLM, annoncé en janvier 2023, Google s’interroge sur le rôle que pourrait avoir l’intelligence artificielle dans la génération de musique. Grâce à quelques mots ou à une phrase, MusicLM est capable de générer en moins de 10 secondes un morceau correspondant à la description. Une sorte de ChatGPT de la musique, comme beaucoup aiment le dire.

Depuis le 10 mai, date où Google a notamment annoncé de nombreux chamboulements liés à l’intelligence artificielle génératrice, il est possible de s’inscrire sur le site de Google Labs pour demander un accès anticipé à MusicLM. Nous l’avons fait, voici notre premier retour.

Un prototype qui a des airs de prototype

À l’heure où l’IA est capable d’imiter un artiste (on pense au faux titre de Drake et The Weeknd, ou à des fantômes de Freddy Mercury et de Michael Jackson), MusicLM interroge logiquement. Google a-t-il mis au point l’outil ultime pour permettre à n’importe qui de sortir un hit ? Malheureusement et heureusement, la réponse est non.

Pour des raisons éthiques, Google avance très prudemment avec l’IA. MusicLM, dans sa version de mai 2023, est très performant, mais se contente d’exporter des extraits sonores de 20 secondes, que l’on peut juste télécharger en MP3 (en mono). MusicLM a aussi plein d’autres limites, comme l’impossibilité d’imiter un artiste. Écrivez « dans le style de Daft Punk » dans un prompt et vous aurez un message d’erreur. MusicLM n’est pas un outil conçu pour imiter, mais pour créer.

La page d'accueil de MusicLM. On écrit dans le champ texte ce que l'on veut, le résultat apparaît à droite. // Source : Capture Numerama
La page d’accueil de MusicLM. On écrit dans le champ texte ce que l’on veut, le résultat apparaît à droite. // Source : Capture Numerama

À chaque fois, MusicLM génère deux extraits. C’est l’utilisateur qui vote pour son préféré, pour aider le modèle de langage à s’améliorer.

Officiellement, MusicLM ne parle que l’anglais. Cependant, quand on lui parle en français, il comprend parfaitement. Une nouvelle illustration du fait que les IA n’ont pas vraiment besoin d’apprendre une langue, puisqu’elles interprètent des mots et devinent un contexte.

MusicLM est parfois très amusant

Sur sa page Github, Google donne plein d’exemples des capacités de MusicLM. Longs morceaux, indications précises en donnant des timecode… Sur le papier, MusicLM est capable de gérer de prompts longs, qui lui indiqueraient sur plusieurs lignes ce que l’on attend précisément d’un morceau.

La réalité est que l’IA est aujourd’hui trop limitée pour ça, tous les prompts aboutissent à des extraits de 20 secondes.

Cependant, sur certaines consignes précises, MusicLM est très satisfaisant. Voici quelques exemples de prompts qui ont donné des choses plutôt enthousiasmantes, en phase avec nos idées :

  • « musique douce pour dormir, un peu de piano et de trompette »;
  • « rap américain, paroles qui vont vite, des percussions avec de la batterie »,
  • « musique triste, type variété française. On imagine de la pluie derrière »,
  • « le prochain hit de l’été. Musique électronique, plusieurs chanteurs, dansant, chantant, envie de faire la fête. Un solo de guitare au milieu »,
  • « une musique électronique d’un jeu de vidéo. Il faut s’enfuir et la musique devient de plus en plus stressante ».
Chaque extrait fabriqué peut être visualisé sous la forme d'une courbe. // Source : Numerama
Chaque extrait fabriqué peut être visualisé sous la forme d’une courbe. // Source : Numerama

En revanche, certaines consignes n’ont pas du tout marché :

  • Tous les prompts avec le nom d’un artiste,
  • « La musique d’une émission télé d’aventure, type Fort Boyard » (ça ne marche pas du tout),
  • « La musique d’une émission télé d’aventure, avec des épreuves et des candidats qui recherchent des clés » (on a un résultat, mais il est beaucoup trop doux pour une émission d’aventure).

MusicLM est-il le futur de la musique ? Il faudrait être fou pour le prédire. Toujours est-il que sa capacité à générer de la musique rapidement est impressionnante, encore plus quand on sait que le logiciel est complètement bridé. Si Google ne l’ouvre pas plus, nul doute qu’un autre développeur finira par mettre au point une IA capable de tout concevoir en quelques secondes.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !