Des chercheurs de l’Université de Rochester sont parvenus à créer un fichier de reproduction musical 1.000 fois plus léger qu’un fichier MP3. Un extrait de 20 secondes d’un solo de clarinette est ainsi encodé avec moins de 1 kilo-octets, grâce à un procédé qui est cependant beaucoup plus proche dans son concept du MIDI que du MP3.

Pour réussir cet exploit, les chercheurs n’enregistrent pas la prestation à la manière d’un magnétophone, qui nécessite plusieurs milliers de données par seconde d’enregistrement, mais enregistrent les notes et la façon dont le joueur de clarinette les interprète physiquement. Le professeur Mark Bocko et ses étudiants Xiaoxiao Dong et Mark Sterling ont ainsi créé un logiciel qui modélise à la fois les caractéristiques de la clarinette, et le jeu de l’interprète : le doigté, la pression d’air et la pression des lèvres notamment.

A l’enregistrement, le système analyse le son produit par l’interprète et les traduit en mouvements d’interprétation de l’instrument. Lors de la lecture, inversement, les mouvements enregistrés sont reproduits à travers la version modélisée de la clarinette, pour émettre une musique de synthèse très proche de la réalité.

Le résultat n’est pas encore parfait, mais le résultat présenté cette semaine lors d’une conférence sur la synthèse acoustique à Las Vegas est semble-t-il très prometteur. A l’heure où les capacités de stockage deviennent virtuellement infinies, l’intérêt pour un système de compression aussi performant est nul au niveau de la taille des fichiers. En revanche, le principe de la reproduction par imitation pourrait être adapté à terme pour la synthèse vocale, en reproduisant virtuellement les mouvements des lèvres, de la langue et du larynx pour imiter la voix humaine.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !