À l’occasion de sa conférence re:MARS, Amazon a dévoilé une technologie capable d’imiter la voix d’une personne grâce à plusieurs extraits audio. Son objectif est de permettre à son assistant vocal de reprendre, par exemple, la voix de votre grand-mère.

Amazon joue avec le feu. Si le sujet de la résurrection virtuelle n’est pas nouveau, le géant américain vient de franchir un nouveau pas avec une technologie dévoilée le 22 juin lors de sa conférence re:MARS. Les scientifiques en charge d’Alexa, l’assistant vocal d’Amazon, ont mis au point une technologie capable d’imiter la voix d’une personne en écoutant plusieurs extraits audio originaux. 1 minute de discours permet à l’IA de parler longuement avec une voix semblable à celle de la personne tampon.

Si, techniquement, cette technologie peut simplement servir à améliorer la modélisation vocale, Amazon veut aller beaucoup plus loin. Il la présente comme un moyen de ressusciter la voix de sa grand-mère décédée, pour avoir l’impression de discuter avec elle quand on parle à Alexa. « Nous vivons incontestablement l’âge d’or de l’IA, où nos rêves et la science-fiction deviennent une réalité. » se félicite Rohit Prasad, le scientifique en charge d’Alexa.

Des deep fakes audio

Techniquement, la prouesse d’Amazon tient dans la courte durée des extraits à analyser. Il fallait auparavant des heures pour apprendre une voix à une machine, le géant du e-commerce passe maintenant sous la minute. Cependant, ce qu’il fait n’est pas inédit. Il n’a jamais été techniquement difficile d’imiter une voix à partir d’extraits originaux et de deep learning (la machine analyse plein de morceaux, les met en relation et crée elle-même une modélisation). En revanche, éthiquement, cela pose problème.

Puisque la personne imitée n’est pas consentante, on tombe dans le domaine des deep fakes. Un peu à la manière de Thierry Ardisson qui interviewe Dalida, Amazon joue avec la frontière entre le monde des vivants et le monde des morts, tout en mettant de côté la question morale de faire parler quelqu’un qui n’est plus là pour se défendre. Certes, Alexa ne prétendra jamais être votre grand-mère, mais l’illusion pourrait tromper un utilisateur non averti. Ce qu’il se passe avec l’ingénieur de Google convaincu que son IA est consciente est un bel exemple des dérives de cette technologie. On peut facilement tomber dans le piège et ne plus dissocier réel et irréel. Bref, Amazon ouvre une boîte de Pandore. Autre problématique : cette technologie peut, techniquement, imiter n’importe qui. Et donc faire dire n’importe quoi à quelqu’un de bien vivant. Amazon prend le risque de rendre accessible une technologie pas facile à maîtriser actuellement.

amazon echo 3
Une enceinte Amazon Echo. // Source : Amazon

Loin de nous l’idée de nier les bienfaits que pourrait apporter une telle prouesse à une partie de la société. Nombreuses sont les personnes qui ont perdu un proche et qui rêveraient de pouvoir discuter avec, au moins artificiellement, de temps en temps. Pour elles, l’annonce d’Amazon soulève sans doute de l’espoir. Les inquiétudes concernent plutôt la manière dont Amazon mettra en place tout ce système, si la technologie est un jour commercialisée. La limite n’est plus technique depuis longtemps, mais morale. Si cette étape est réellement franchie, quelle sera la prochaine ?