Une polémique importante est apparue fin août concernant la version en scots de Wikipédia. Un internaute accuse un bénévole d’avoir créé et édité des dizaines de milliers d’articles dans une langue qu’il ne maîtrise pas du tout.

C’est à partir d’un sujet publié sur Reddit que la controverse est née : selon les constats d’un internaute se faisant appeler Ultach, la quasi-totalité des articles de Wikipédia rédigés en langue scots aurait été écrite par un adolescent américain ne sachant pas un traître mot de ce dialecte, essentiellement parlé en Écosse et en Irlande du Nord.

Partagée dans la rubrique de Reddit consacrée à l’Écosse, la nouvelle a vite suscité un débat sous la publication d’Ultach, mais aussi des reprises dans la presse, à l’image de The Register ou Gizmodo. Car les observations d’Ultach sont potentiellement graves pour la crédibilité de Wikipédia, du moins pour celle de la déclinaison de Wikipédia en scots, qui compte près de 58 000 articles.

« J’ai découvert que presque tous les articles sur la version scots de Wikipédia sont écrits par la même personne – un adolescent américain qui ne parle pas le scots », affirme-t-il. D’après lui, cette déclinaison de Wikipédia est même réputée pour être « dramatiquement mauvaise », à tel point qu’elle servirait même aux détracteurs du scots pour dire qu’il ne s’agit pas vraiment d’une langue.

Scots Wikipedia

La page d’accueil de Wikipédia en scots.

Le scots est une langue germanique très proche de l’anglais. Parlée au nord du Royaume-Uni, elle compterait près de 99 000 locuteurs natifs et près de 1,5 million d’autres locuteurs. Le scots, bien qu’ayant des points communs avec l’anglais écossais, est toutefois distinct. La proximité avec l’anglais se voit en comparant par exemple les traductions du premier article de la Déclaration universelle des droits de l’homme.

En anglais :

All human beings are born free and equal in dignity and rights. They are endowed with reason and conscience and should act towards one another in a spirit of brotherhood.

En scots :

Aw the human beins are born free an’ equals in dignity an’ richts. They are endowed wi’ reason an’ conscience an’ should act towards the others in a speireit o’ breatherhood.

Un bénévole qui ne comprend pas ce qu’il écrit

Ultach confie dans son article qu’il connaissait la piètre notoriété de Wikipédia en scots depuis quelques années, mais il attribuait jusqu’à présent ce faible niveau à l’amateurisme des contributeurs. Sauf qu’il a fini par se rendre compte que toutes ces éditions bancales étaient surtout le fait d’une seule et même personne. C’est en consultant l’historique d’une de ces pages qu’il a fini par découvrir le pot aux roses.

« J’ai vérifié l’historique des modifications pour voir si quelqu’un avait déjà essayé de  corriger [l’énième erreur linguistique qui l’avait fait tiquer, NDLR], mais la page n’avait été modifiée que par une seule personne », a-t-il fait savoir. C’est là qu’il a découvert que l’intéressé a créé et édité des « dizaines de milliers d’autres articles », sur une version de l’encyclopédie qui n’en compte qu’un peu moins de 60 000.

« Chaque page qu’il avait créée était la même. Identique à la version anglaise de l’article, mais avec quelques modifications orthographiques ici et là, et si vous avez vraiment de la chance, peut-être un mot écossais glissé au milieu », poursuit-il. Pour soutenir son propos, Ultach donne diverses illustrations des horreurs de style et des fautes qu’il a croisées, mais que seuls des linguistes anglophones saisiront.

Source : woodypino

Le scots est surtout parlé en Ecosse et en Irlande du Nord. // Source : woodypino

Par exemple, des mots pourtant courant en scots, que l’on retrouve aussi souvent en anglais écossais, comme « syne » et « an aw », sont utilisés à mauvais escient. D’autres mots sont inventés pour les faire ressembler à des mots anglais écrits phonétiquement et parlés avec un accent scots, comme « saive » au lieu de « hain » ou  « moost » au lieu de « maun ».

Le mot anglais « also » est systématiquement traduit en « an aw », quel que soit le contexte. Ainsi, il est dit sur Wikipédia en scots que Charles V est le roi de Saint-Empire Germanique et aussi d’Espagne (« king o the Holy Roman Empire and an aw Spain »). Pourquoi fait-il cela ? Ultach pense que c’est parce que la première traduction qui apparaît dans le dictionnaire scots en ligne pour « also » est « an aw ». Une erreur grossière de débutant. Et pour ne rien arranger, toujours selon Ultach, ce dictionnaire n’est même pas très bien réputé dans son domaine.

Pour l’auteur du billet Reddit, le verdict est sans appel : cette personne ne sait pas parler et ne peut pas parler scots. « Je ne veux pas dire par là qu’elle fait de son mieux, mais qu’elle fait quelques erreurs, je veux dire qu’elle ne semble avoir aucune connaissance de la langue », écrit-il. Elle ne se sert pas des mots scots appropriés, elle n’utilise pas la grammaire scots, il y a des termes scots insérés au hasard dans des phrases anglaises. Bref, il n’y a absolument rien qui tient debout.

« Elle ne semble avoir aucune connaissance de la langue »

L’affaire aurait pu faire sourire, si l’intervention de ce wikipédien avait été anecdotique. Or, la magnitude avec laquelle il a édité Wikipédia en scots fait dire à Ultach que « cette personne a probablement fait plus de dégâts à la langue scots que n’importe qui d’autre dans l’histoire. Elle s’est livrée à un vandalisme culturel d’une ampleur sans précédent jusqu’à présent ». Un commentaire de prime abord excessif, mais Wikipédia est aussi l’un des sites les plus visités au monde. De fait, de nombreux internautes anglophones ou non ont été forcément exposés à cette logorrhée scripturale.

« Potentiellement, des dizaines de millions de personnes pensent maintenant que le scots est une représentation horriblement abîmée de l’anglais plutôt que d’être une langue ou un dialecte à part entière, tout cela parce qu’elles ont été exposées à une représentation abîmée de l’anglais étant appelé scots par cette personne et par cette personne seulement », déplore Ultach.

Selon les statistiques affichées sur la page de ce bénévole, il revendique plus de 200 000 éditions et 20 000 articles écrits — et ces statistiques n’ont pas été renouvelées depuis 2018. Autrement dit, l’intéressé est impliqué dans au moins un tiers des sujets écrits en scots. Et selon le compteur d’activité du bénévole, il a continué à « contribuer » au projet encyclopédique entre 2018 et 2020.

Scots Wikipedia bénévole

Source : Ultach

Quelles motivations derrière cet activisme ?

Ce que n’arrive pas à saisir Ultach, ce sont les intentions de ce mystérieux internaute : s’agit-il d’un acte de vandalisme méthodique ou bien d’une nuisance involontaire, avec un internaute « croyant bien faire » et recherchant une certaine notoriété au sein du reste de la communauté des Wikipédiens ? Car selon sa page Wikipédia, cela fait des années qu’il fait ça, avec une présence significative depuis 2013.

« S’il avait fait tout ça correctement, cela aurait été une réussite incroyable. Il y travaillait depuis près de dix ans, avec une moyenne d’environ neuf articles par jour. Et en plus de tout cela, il était le principal administrateur de la Wikipédia en langue scots elle-même, et ce depuis environ 7 ans », commente Ultach. Mais ce n’est pas ce qu’il s’est produit. Quant aux autres contributions de vrais locuteurs, elles ont été de fait noyées par le raz-de-marée de l’intéressé.

Compte tenu de la nature publique de Wikipédia, il n’est pas très difficile de parcourir la version scots de Wikipédia pour découvrir l’identité — du moins, le pseudonyme — de celui par qui le scandale est arrivé. Ultach n’a toutefois pas souhaité le publier dans son billet, pour lui éviter de subir des représailles ou du harcèlement. Il voudrait surtout qu’il saisisse l’occasion de s’améliorer.

« Il a merdé et je suis sûr qu’il le sait maintenant. Il semble être une personne assez gentille qui a fait une erreur quand elle était jeune, une erreur que personne d’autre ne s’est jamais donné la peine de corriger, donc ce n’est pas vraiment sa faute. Il est manifestement très passionné et dévoué et, avec un peu de chance, il pourra peut-être profiter de cette occasion pour apprendre la langue correctement et apporter une contribution positive », veut croire Ultarch, en espérant qu’il ne prenne pas tout ça trop personnellement et qu’il n’en souffre pas trop.

Peine perdue, toutefois, du moins en ce qui concerne le harcèlement. L’auteur a appris que des internautes avaient commencé à s’en prendre à lui à la suite de cette publication sur Reddit, forçant Ultach à éditer son sujet pour mettre les choses au point : « Cela devrait aller de soi, mais je n’approuve pas du tout ces agissements ». Un malheur ne vient jamais seul.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !