Les équipes de Yahoo ont mis au point un algorithme pour détecter les nouveaux mots susceptibles d'être utilisés dans les "messages de haine" publiés par les internautes, et ainsi aider les modérateurs à détecter et supprimer les messages très rapidement, voire les supprimer automatiquement.

Voilà qui pourrait aider la future "Unité nationale de lutte contre la haine sur Internet" voulue par Manuel Valls, qui devra mettre en place une HADOPI contre les discours racistes, antisémites, xénophobes, homophobes, et autres. Des chercheurs de Yahoo prévoient de dévoiler le 18 mai prochain à Florence lors de l'International World Wide Web Conference les détails de travaux qu'ils ont réalisé pour faciliter la détection des discours de haine sur Internet.

Estimant que les discours de haine sont "une plaie pour les sites web qui permettent aux utilisateurs de laisser des commentaires, ayant un impact négatif sur leur business et sur l'expérience utilisateur dans son ensemble", les chercheurs de Sunnyvale ont mis au point un algorithme qui reconnaît automatiquement les messages d'incitation à la haine, grâce à une technique d'acquisition neuronale du langage. L'objectif est de dépasser les simples filtrages par mots clés installés sur la plupart des grands sites internet, pour reconnaître y compris les mots que les internautes utilisent pour tenter de contourner la censure automatisée. L'intelligence artificielle saisit qu'un nouveau mot est utilisé dans le même contexte qu'une expression bannie par les modérateurs, et considère donc qu'il est utilisé comme substitut.

Pour entraîner leur algorithme, les chercheurs ont utilisé une base de 895 456 commentaires "propres" générés par 209 779 utilisateurs des forums de Yahoo Finance, ainsi que 56 280 commentaires qui avaient été signalés comme contenant des discours de haine. Ils ont pu ainsi construire un nuage de mots sémantiquement proches du mot interdit "fuck", pour améliorer les outils de censure automatisée ou assistée.

Selon eux, les résultats obtenus "montrent clairement les bénéfices de l'approche proposée, et constituent un pas en avant dans la solution au problème de la détection des discours de haine dans les commentaires des utilisateurs en ligne".

Partager sur les réseaux sociaux

Articles liés