Avec Voice Translation, Spotify s’aventure un peu plus sur le terrain de l’intelligence artificielle. Le géant du streaming utilise notamment une technologie d’imitation vocale développée par OpenAI pour modifier la langue d’une personne sans toucher à sa voix.

Dans un futur proche, un Français qui ne maîtrise aucune langue étrangère pourra-t-il écouter une interview du New York Times, un podcast en italien ou une recette de cuisine en arabe dans la seule langue qu’il parle ?

À en croire Spotify, demain est déjà là. Le géant suédois du streaming a annoncé le 25 septembre 2023 lancer « Voice Translation », une intelligence artificielle basée sur plusieurs technologies sophistiquées (dont des modèles vocaux développés par OpenAI), capable de changer la langue d’un podcast sans dénaturer la voix de son auteur. Une annonce similaire à des projets comme ceux de HeyGen, qui pourraient bouleverser le monde du doublage.

Voice Translation est déjà là

Avec sa nouvelle technologie, Spotify a potentiellement de quoi mettre fin à la problématique du doublage et des sous-titres. Tous les contenus pourraient être traduits dans toutes les langues automatiquement, sans la moindre action humaine. Les plus menacés sont évidemment les doubleurs qui, s’ils n’ont jamais été vraiment présents dans l’univers du podcast, pourraient voir d’un mauvais œil la possibilité de voir l’IA doubler des stars américaines au cinéma.

Combien de temps faudra-t-il pour que Voice Translation soit prêt ? La réponse va vous surprendre : il l’est déjà. Plusieurs podcasts en anglais (Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, Steven Bartlett…) ont déjà été traduits en français, en allemand et en espagnol grâce à cette technologie. Trois épisodes sont d’ores et déjà disponibles, d’autres arriveront prochainement.

Les trois premiers podcasts traduits par l'IA.
Les trois premiers podcasts traduits par l’IA. // Source : Spotify

Voice Translation n’est pas la première annonce de Spotify en matière d’IA. En février 2023, le géant du streaming avait annoncé lancer « DJ », un assistant vocal qui imite un animateur de radio. Voice Translation étend les possibilités du Suédois, en le préparant à un monde dans lequel l’IA sera encore plus présente. C’est aussi un moyen pour Spotify d’étendre son importance sur le secteur des podcasts, en devenant le premier à proposer des contenus disponibles en plusieurs langues, sans le moindre effort.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !