Les équipes de Yahoo ont mis au point un algorithme pour détecter les nouveaux mots susceptibles d'être utilisés dans les "messages de haine" publiés par les internautes, et ainsi aider les modérateurs à détecter et supprimer les messages très rapidement, voire les supprimer automatiquement.

Voilà qui pourrait aider la future "Unité nationale de lutte contre la haine sur Internet" voulue par Manuel Valls, qui devra mettre en place une HADOPI contre les discours racistes, antisémites, xénophobes, homophobes, et autres. Des chercheurs de Yahoo prévoient de dévoiler le 18 mai prochain à Florence lors de l'International World Wide Web Conference les détails de travaux qu'ils ont réalisé pour faciliter la détection des discours de haine sur Internet.

Estimant que les discours de haine sont "une plaie pour les sites web qui permettent aux utilisateurs de laisser des commentaires, ayant un impact négatif sur leur business et sur l'expérience utilisateur dans son ensemble", les chercheurs de Sunnyvale ont mis au point un algorithme qui reconnaît automatiquement les messages d'incitation à la haine, grâce à une technique d'acquisition neuronale du langage. L'objectif est de dépasser les simples filtrages par mots clés installés sur la plupart des grands sites internet, pour reconnaître y compris les mots que les internautes utilisent pour tenter de contourner la censure automatisée. L'intelligence artificielle saisit qu'un nouveau mot est utilisé dans le même contexte qu'une expression bannie par les modérateurs, et considère donc qu'il est utilisé comme substitut.

Pour entraîner leur algorithme, les chercheurs ont utilisé une base de 895 456 commentaires "propres" générés par 209 779 utilisateurs des forums de Yahoo Finance, ainsi que 56 280 commentaires qui avaient été signalés comme contenant des discours de haine. Ils ont pu ainsi construire un nuage de mots sémantiquement proches du mot interdit "fuck", pour améliorer les outils de censure automatisée ou assistée.

Selon eux, les résultats obtenus "montrent clairement les bénéfices de l'approche proposée, et constituent un pas en avant dans la solution au problème de la détection des discours de haine dans les commentaires des utilisateurs en ligne".

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !