Un bref enregistrement sonore, publié le 15 mai sur Twitter, divise les internautes. Certains entendent le mot « Laurel », d'autres « Yanny » — et parfois les deux. Pas de panique : l'explication repose sur notre perception des différentes tonalités de voix.

Dans la nuit du lundi 15 mai 2018, la youtubeuse Cloe Feldman a publié sur son compte Twitter aux 207 000 abonnés un bref enregistrement sonore, demandant aux internautes de voter pour le son qu’ils entendaient dans cet extrait.

« Qu’entendez-vous ? Yanny ou Laurel », interroge-t-elle, dans une publication désormais retweetée plus de 26 000 fois. En copie, une vidéo qu’elle a trouvée sur Reddit — et dont elle cherche aujourd’hui l’auteur original — d’une voix artificielle qui prononce un mot.

À l’écrit, les mots Yanny et Laurel ont l’air complètement différents. Et pourtant. Il n’en a pas fallu davantage pour que les utilisateurs de Twitter, Reddit et Instagram entrent dans le débat pour tenter de savoir quel son émanait vraiment de cette voix.

Que vous entendiez l’un ou l’autre de ces termes, plusieurs explications ont été publiées pour tenter d’apporter une réponse à cette énigme. Tout d’abord, il semblerait que le type d’enceinte, ou de casque audio, que vous utilisez pour écouter cet extrait influence le son que vous allez entendre.

« Bien que nos sensations nous paraissent exactes et véridiques, elles ne reflètent pas nécessairement la réalité physique du monde extérieur », notent Susana Martinez-Conde et Stephen L. Macknik, ophtalmologues rattachés au SUNY Downstate Médical Center de Brooklyn à New York.

« Quand vous parlez, vous produisez des ondes sonores qui sont façonnées par l’étendue et la forme de votre voix, ce qui inclut votre larynx, votre gorge, vos codes vocales, votre bouche et votre nez, complète la linguiste Rachel Gutman dans The Atlantic. Les linguistes peuvent étudier ces ondes sonores et séparer les fréquences qui les composent, et les visualiser dans un spectrogramme. »

Aidée par Chelsea Sanker, phonéticienne à l’Université Brown, elle fait observer que la différence de perception vient de la tonalité de la voix enregistrée. « En général, les gens entendent Yanny de manière plus cohérente quand la tonalité est plus basse, et Laurel quand elle est plus haute », explique la linguiste.

Vous pouvez d’ailleurs en faire l’expérience grâce à ces différentes versions de l’enregistrement, publiées par l’ingénieur Steve Pomeroy sur Twitter.

