Google annonce l’ajout de treize nouvelles langues dans son service de traduction, dont le corse, l’hawaïen et le pachtoune.

« Frivaghju, t’hà setti barretti ». Vous ne savez pas ce que cela veut dire ? Google, si. La firme de Mountain View vient en effet de faire de nouveaux progrès en langue avec l’ajout, dans son service de traduction, de treize nouveaux dialectes, ce qui lui permet aujourd’hui de comprendre un total de 103 langues différentes.

Qu’il semble loin le temps où l’entreprise américaine, au moment du lancement de Traduction en 2006, ne pouvait traiter qu’en une petite poignée… et surtout les plus communes ! Dix ans plus tard, Traduction a pris de l’ampleur et la société affirme être en mesure de « couvrir 99 % de la population en ligne ».

Google pixels

Treize nouvelles langues ajoutées.

Ces dix nouvelles langues, quelles sont-elles ?

On trouve des langues parlées en Europe, comme le corse, le luxembourgeois, le frison et le gaélique écossais, mais pas seulement : amharique, kirghize, hawaïen, kurde (kurmandji), samoan, shona, sindhi, pachtoune et xhosa. Certaines vous parleront sans doute, d’autres nécessiteront un petit tour sur Wikipédia.

Il reste évidemment encore beaucoup de chemin avant de couvrir la totalité des langues qui existent sur Terre. Selon l’édition 2013 de l’Ethnologue, il y a plus de 7105 langues vivantes. À supposer que cette liste est exhaustive, cela veut dire que Google ne couvre qu’un peu plus de 1,4 % du total. Il y a encore du boulot…

103 langues prises en compte, des milliers restantes.

Cela étant dit, toutes les langues vivantes n’ont pas forcément un support écrit. Or, pour en ajouter une à Traduction, la firme de Mountain View rappelle que celle-ci doit exister sous forme de texte et qu’il doit y avoir bien évidemment assez de ressources en ligne pour pouvoir opérer des traductions.

Et malgré le gap important à combler, Google veut se féliciter de ce récent ajout. Avec lui, Google estime que son service pourra servir à 120 millions de personnes supplémentaires. Et comme ça, vous saurez que « frivaghju, t’hà setti barretti » est un proverbe corse qui signifie que le temps est très changeant en février.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !