La fondation Wikimédia travaille sur un outil permettant de simplifier la traduction des articles d'une langue à l'autre, via l'automatisation de certaines tâches (mise en forme, ajout des liens internes, etc). La version beta couvre huit langues.

Avec 288 langues au compteur, Wikipédia est indéniablement l'encyclopédie multilingue la plus ambitieuse jamais réalisée. Toutefois, le développement de chaque déclinaison linguistique du site est loin d'être aussi abouti que la version anglophone et ses 4,7 millions d'articles. Certaines éditions de Wikipédia ne comptent que quelques pages, du fait du faible nombre de locuteurs impliqués dans le projet.

Afin de faciliter les échanges entre les différentes versions de l'encyclopédie, la fondation Wikimédia travaille depuis 2014 sur un outil permettant de traduire automatiquement des sujets d'une langue à l'autre tout en conservant la mise en forme générale ainsi que les éléments qui peuvent s'avérer fastidieux à insérer (liens internes, liens externes, articles connexes…).

Après quelques étapes préliminaires, l'outil est désormais sur le point d'entrer dans une phase beta. De ce fait, celui-ci sera en mesure de supporter plusieurs nouvelles langues : le catalan, le danois, l'espéranto, l'indonésien, le malais, le bokmål (variante du norvégien), le portugais et l'espagnol. Certaines d'entre elles (catalan et espagnol) étaient déjà supportées dans de précédentes versions.

La traduction est opérée par Apertium, un logiciel de traduction automatique basé sur des dictionnaires et des règles de transfert développé initialement par l'université d'Alicante. C'est un logiciel libre distribué selon les termes de la licence GNU GPL 2.0, précise l'article Wikipédia qui lui est consacré.

Comment ça marche ?

Une fois connecté à Wikipédia, il faut se rendre sur une déclinaison linguistique de l'encyclopédie qui est actuellement prise en compte. Là, un outil de traduction est disponible dans la page d'utilisateur à la rubrique contribution. Il faut alors sélectionner un article qui n'existe pas dans votre langue (en fait, celle de la langue de la version Wikipédia sur laquelle vous vous trouvez) et lancer la traduction.

Bien sûr, toute traduction automatique a ses limites. Si les outils s'améliorent année après année, les usagers devront quand même vérifier la qualité du résultat et retoucher ici et là les erreurs d'adaptation. L'avantage de ce système est en tout cas de permettre aux usagers de se concentrer sur le texte et de ne pas perdre trop de temps avec la mise en forme de l'article.


Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !