Google Traduction propose des résultats… étonnants. Bug, fonctionnalité ou IA en quête de sens ?

Alors que la France attend des réponses atour de l’affaire Benalla, de l’autre côté de l’Atlantique, le Translate Gate fait vibrer Reddit et la presse anglophone. Translate, pour Google Translate, connu dans nos contrées sous le nom Google Traduction. Et en effet, le service en ligne du géant de Mountain View connaît un nombre important de glitches aux sonorités religieuses. Il n’en fallait pas plus à l’imagination du web pour échafauder une théorie fondée sur la prise de conscience de l’intelligence artificielle qui s’en remet dès ses premiers pas dans le monde à une entité religieuse, désespérée par l’humanité qu’elle vient de découvrir.

Nous approchons de la fin des temps et du retour de Jésus

Une version de l’affaire qui n’a évidemment pas de sens, mais il faut reconnaître que les messages de Google Translate laissent songeurs. En tapant 19 fois « dog » par exemple, et en choisissant une traduction de l’Anglais au Maori, Google Traduction répond la chose suivante : « Doomsday Clock is three minutes at twelve We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return ». En Français, cela donnerait : « L’Horloge de l’Apocalypse est à 3 minutes de minuit. Nous rencontrons des personnages et des scénarios dramatiques dans le monde, qui indiquent que nous approchons de la fin des temps et du retour de Jésus ». Rien que ça.

Mais ce n’est pas tout : le forum ouvert sur Reddit regorge d’exemples aux sonorités bibliques. Depuis le Somali jusqu’à l’Anglais, on trouve par exemple de nombreux exemples qui donnent des traductions étonnantes à partir d’une simple suite de « ag ».

googleno

Il faut noter que les traductions depuis le français donnent à peu près la même chose dans notre langue. Nous avons testé les suites de « ag », pour un résultat proche de ce que trouvent les anglophones, dans la langue de Molière :

Capture d’écran 2018-07-23 à 09.43.13

Capture d’écran 2018-07-23 à 09.43.36

Capture d’écran 2018-07-23 à 09.43.51

Comment expliquer cela ?

Google Traduction, aussi romantique puisse être l’explication, n’est pas devenu une intelligence artificielle mystique. Du côté de Google, la réponse officielle donnée à plusieurs médias est la suivante : « C’est une réponse au non sens par le non sens ». En d’autres termes, si l’utilisateur met des suites de mots qui n’ont pas de sens dans le système, le système génère lui aussi des suites de mots qui n’ont pas de sens. Et au-delà des prophéties aux sonorités bibliques, il faut reconnaître que les traductions proposées ne donnent pas beaucoup de matière à réflexion.

Le fait que des phrases qui sonnent comme un texte religieux soient affichées pourrait avoir un lien avec la méthode d’entraînement de Google Traduction. Contrairement à ce qu’on pourrait croire, le service de Google ne se contente pas de traduire un mot dans une autre langue à partir d’une base de données : il s’agit d’un algorithme entraîné des millions de fois avec des textes traduits par des humains dans plusieurs langues. Et si Google n’a pas confirmé que des textes religieux ont été utilisés par les ingénieurs pour entraîner l’algorithme, la piste nous semble bonne : ces textes sont parmi les plus traduits au monde, dans de nombreuses versions et avec en prime une hiérarchisation des informations quasi mathématique.

Quant à la théorie qui voudrait qu’il s’agisse de google traduction bombing orchestré par des internautes chenapans avec la fonction « suggérer une meilleure traduction », elle ne tient pas : les textes de réponse présentent trop de similitudes et de bizarreries dans les différentes langues.


Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !