Publié le 16 février 2015 à 13h58

Facebook prépare son propre traducteur alimenté par vos posts

2 min

Guillaume Champeau

2 min

2 min

Guillaume Champeau

Résumer l'article

Résumé par IA, vérifié par Numerama

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Facebook a dévoilé une étude qui montre qu'il utilise les publications de ses membres pour enrichir ce qui devrait être son propre moteur de traductions automatisées.

Depuis 2011, Facebook propose à ses utilisateurs de lire les publications étrangères dans leur propre langue, grâce à un partenariat avec l'outil de traduction Bing Translate de Microsoft. Lorsqu'un message est publié dans une autre langue, il suffit de cliquer sur "voir la traduction" pour comprendre aussitôt ce qu'il veut dire. Mais il semble que Facebook travaille sur son propre outil de traduction pour améliorer la fonctionnalité, en ayant recruté une équipe de chercheurs issus pour la plupart de l'Université Carnegie Mellon.

Dans une étude attribuée à Facebook Inc et publiée par le réseau social (mais présentée pour la première fois lors d'une conférence d'experts en décembre 2014), quatre chercheurs spécialisés dans la traduction automatisée ont présenté une méthode pour affiner la qualité des traductions par ordinateur, en utilisant les publications des utilisateurs de Facebook. Le but des chercheurs était d'enrichir le corpus de référence de textes en plusieurs langues, utilisé par apprentissage machine pour deviner les meilleures traductions possibles d'un texte selon des méthodes heuristiques.

L'HUMAIN EST PRÉVISIBLE

Mathias Eck, Yury Zemlyanskiy, Joy Zhang et Alex Waibel expliquent qu'ils ont ainsi réussi à améliorer la qualité des traductions obtenues par cette méthode en enrichissant automatiquement la base de données de phrases traduites, extraites des messages des utilisateurs de Facebook selon deux méthodes. La première est assez basique puisqu'il s'agissait simplement de prendre les messages que les utilisateurs avaient eux-mêmes traduits en plusieurs langues, ce qui est parfois le cas aux Etats-Unis lorsque des marques ou des personnalités veulent s'adresser à leur public à la fois en anglais et en espagnol. La deuxième méthode est en revanche beaucoup plus audacieuse.

Ils sont en effet partis du principe que des internautes du monde entier qui partageaient le même lien avaient certainement les mêmes choses à dire sur le contenu, et qu'il était possible de deviner par des méthodes algorithmiques les posts publiés dans des langues différentes qui voulaient dire exactement la même chose. Et ça fonctionne. La solution aurait obtenu de meilleurs résultats qu'avec le corpus de base, composé de traductions officielles réalisées par le Parlement Européen et de phrases traduites par la communauté Tatoeba.

La méthode a en outre pour avantage de se reposer sur un langage très naturel, avec son argot et ses fautes de grammaire ou d'orthographe courantes. Et avec 1,4 milliards d'utilisateurs dans le monde, Facebook apprendra très vite à traduire dans les différentes langues.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Pour ne rien manquer de l’actualité, suivez Numerama sur Google !

Signaler une erreur dans le texte

Partager l'article

Facebook prépare son propre traducteur alimenté par vos posts

« Il ne prend pas de vacances » : ces chiens robots à 300 000 $ surveillent des data centers aux États-Unis

Ce chargeur MagSafe coûte autant que 5 MacBook Neo

Un sèche-cheveux et 2,5 milliards de dollars : comment cet incroyable réseau de contrebande a inondé la Chine de puces Nvidia

Bernie Sanders interviewe Claude : pourquoi son réquisitoire contre l’IA est un contresens technique

Moxie Marlinspike (Signal) s’allie à Meta pour « bunkeriser » vos conversations avec l’IA

Quels sont les meilleurs casques audio Bluetooth à réduction de bruit en 2026 ?

Comment devenir invisible sur Strava ?

Huawei définitivement banni des réseaux télécoms en Europe ? La justice européenne tranche

Face aux drones, le futur porte-avions français ne peut plus se contenter de missiles et de canons mitrailleurs

En Chine, votre Big Mac pourrait bientôt être servi par un robot humanoïde