DeepL : on a mis à l'épreuve le traducteur de Linguee qui promet de ridiculiser Google Trad

Google Traduction est aussi apprécié que décrié. Mais si un spécialiste de la langue mettait de son côté les dernières technologies d’apprentissage machine pour proposer un équivalent bien plus puissant ? C’est l’ambition de DeepL. Nous l’avons testé.

La traduction automatique d’une langue vers une autre est un rêve de nombreux récits de science-fiction. C’est aussi l’un des problèmes pratiques les plus intéressants quand il s’agit de travailler sur des algorithmes et de l’apprentissage machine, dans la mesure où ces logiciels sont loin d’être des dictionnaires bilingues. Ils ne traduisent pas mot à mot, mais tentent, depuis longtemps, de dégager un sens pour proposer une traduction naturelle.

Aujourd’hui, on apprend donc à des réseaux neuronaux artificiels à deviner quelle sera la meilleure traduction possible pour une suite de mots que l’on nomme une phrase. Ces réseaux apprennent de leurs erreurs et des corrections faites par les utilisateurs, mais la base de données originale qui a servi à l’entraînement initial est toute aussi importante. C’est là où la solution DeepL de l’outil Linguee, bien connu des traducteurs, pourrait avoir de l’avance.

En effet, Linguee n’est pas un service de traduction classique : plutôt que de donner une translation d’un mot vers son équivalent, il tente de le placer dans le bon contexte pour proposer une traduction adéquate. Pour cela, il va s’appuyer sur un corpus de textes déjà traduits : romans libres de droits, textes de loi internationaux traduits en plusieurs langues, sites proposant différentes versions de leurs contenus… bref, des exemples traduits par des humains.

Cela donne bien souvent les traductions les plus convenables à un traducteur qui chercherait le sens d’un mot dans un contexte précis, vu que le contexte est trouvé par l’outil. DeepL utilise cette base de données riche et un super calculateur en Islande capable e d’effectuer plus de 5 100 000 000 000 000 d’opérations à virgule flottante par seconde pour entraîner ses algorithmes. Le communiqué de presse affirme que cela placerait l’entreprise à la 23e place au concours de celle qui a le plus gros calculateur — pas mal. Avec des combinaisons possibles avec le français, l’anglais, l’allemand, l’espagnol, l’italien, le polonais et le néerlandais, DeepL entend cibler l’Europe avant de s’attaquer au russe, au japonais et au mandarin.

Pour voir si DeepL tient ses promesses, nous avons testé l’engin sur une combinaison assez classique — de l’anglais vers le français et réciproquement.

Dans ce premier exemple, le texte vient de The Verge et a été traduit en français par Google Traduction, puis par DeepL (cliquez sur les images pour les agrandir).

On s’aperçoit très clairement que Google échoue lors de deux pièges que DeepL parvient à déjouer : Google a traduit « remplissant l’emplacement » quand DeepL a compris qu’il s’agissait d’un poste dans le contexte d’une traduction qui tourne autour d’une embauche. Le deuxième piège est celui de la syntaxe que Google n’a pas respectée sur la fin, proposant une absurdité quand DeepL s’en sort avec les honneurs.

Nous avons testé la traduction inverse : prendre un paragraphe de Numerama et le soumettre aux deux traducteurs pour aller vers l’anglais.

Là encore, DeepL gagne. Vous ne voyez pas de grandes différences ? Google a pourtant associé « jeu vidéo » à un « him » quand un « it » aurait été juste. Le traducteur du moteur de recherche n’a pas su mettre en contexte ce « lui » et l’a traduit littéralement sans se demander à quoi il se rapportait.

Dernier petit test, plus littéraire cette fois. Nous avons pris le premier paragraphe de Frankenstein, œuvre monumentale s’il en est de Mary Shelley et nous avons demandé aux deux machines de s’affronter de l’anglais vers le français. Nous avons pris enfin une traduction officielle de l’œuvre pour voir ce qu’aurait fait un traducteur humain (Germain d’Hangest).

La ponctuation est meilleure chez DeepL (la minuscule après le point-virgule) que chez Google et la concordance des temps semble bien plus naturelle chez le traducteur de Linguee que sur celui du géant de Mountain View. Cela dit, il n’y a pas photo : sur un texte littéraire, la traduction humaine est bien plus fluide, plaisante et correcte (notamment le passage sur les « fonctions publiques » traduites chez DeepL et Google par des « situations publiques »). Mais tout de même, DeepL s’approche d’un texte correct qui mériterait simplement quelques retouches.

En conclusion, on peut dire que DeepL est extrêmement prometteur. Il est déjà supérieur à Google Traduction qui, malgré les critiques qu’on entend souvent à son encontre, est un excellent traducteur automatique. Cela montre donc à quel point DeepL sait surclasser son premier concurrent, notamment dans la richesse des détails apportée aux traductions. Il a en tout cas toutes ses chances pour devenir notre référence.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !