Publié le 27 avril 2015 à 09h35

Yahoo a un algorithme pour détecter les messages de haine

Ajouter à vos signets

1 min

Guillaume Champeau

Ajouter à vos signets

1 min

Guillaume Champeau

Les équipes de Yahoo ont mis au point un algorithme pour détecter les nouveaux mots susceptibles d'être utilisés dans les "messages de haine" publiés par les internautes, et ainsi aider les modérateurs à détecter et supprimer les messages très rapidement, voire les supprimer automatiquement.

Voilà qui pourrait aider la future "Unité nationale de lutte contre la haine sur Internet" voulue par Manuel Valls, qui devra mettre en place une HADOPI contre les discours racistes, antisémites, xénophobes, homophobes, et autres. Des chercheurs de Yahoo prévoient de dévoiler le 18 mai prochain à Florence lors de l'International World Wide Web Conference les détails de travaux qu'ils ont réalisé pour faciliter la détection des discours de haine sur Internet.

Estimant que les discours de haine sont "une plaie pour les sites web qui permettent aux utilisateurs de laisser des commentaires, ayant un impact négatif sur leur business et sur l'expérience utilisateur dans son ensemble", les chercheurs de Sunnyvale ont mis au point un algorithme qui reconnaît automatiquement les messages d'incitation à la haine, grâce à une technique d'acquisition neuronale du langage. L'objectif est de dépasser les simples filtrages par mots clés installés sur la plupart des grands sites internet, pour reconnaître y compris les mots que les internautes utilisent pour tenter de contourner la censure automatisée. L'intelligence artificielle saisit qu'un nouveau mot est utilisé dans le même contexte qu'une expression bannie par les modérateurs, et considère donc qu'il est utilisé comme substitut.

Pour entraîner leur algorithme, les chercheurs ont utilisé une base de 895 456 commentaires "propres" générés par 209 779 utilisateurs des forums de Yahoo Finance, ainsi que 56 280 commentaires qui avaient été signalés comme contenant des discours de haine. Ils ont pu ainsi construire un nuage de mots sémantiquement proches du mot interdit "fuck", pour améliorer les outils de censure automatisée ou assistée.

Selon eux, les résultats obtenus "montrent clairement les bénéfices de l'approche proposée, et constituent un pas en avant dans la solution au problème de la détection des discours de haine dans les commentaires des utilisateurs en ligne".

Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !

Signaler une erreur dans le texte

Partager l'article

Sur le même thème

Le stockage sur vos appareils est une tannée : ce fournisseur a une offre unique pour vous

sponso

« Aucun droit à la liberté d’expression pour les machines » : les images Midjourney doivent avoir un label

No country for old men // Source : Paramount Pictures

Que se passe-t-il avec la plateforme Substack et les contenus nazis ?

Ce que dit la loi sur les images pédopornographiques générées par IA

X bloque les recherches sur Taylor Swift à cause des fausses images pornos

Que reproche-t-on à la vidéosurveillance algorithmique pour les JO de Paris 2024 ?

Les derniers articles tech

Source : Marie-Antoinette / Sofia Coppola

tech web réseaux sociaux

« Digitine » : bloquer les célébrités sur les réseaux sociaux, à quoi bon ?

18.05.2024 17:11

Rapport quantité-prix imbattable

140 Go de data en 5G à moins de 10 €/mois, c’est possible avec ce forfait sur le réseau SFR

18.05.2024 15:34

Penelope dans Bridgerton, saison 3. // Source : Netflix

tech

Quel livre adapte la saison 3 de Bridgerton, sur Netflix ?

18.05.2024 11:54

Le Google Pixel 7a. // Source : Thomas Ancelle / Numerama

tech smartphone smartphones android

Le Google Pixel 7a baisse de prix et s’accompagne d’un chargeur

18.05.2024 10:23

Pratique, ultra-réactif et et gratuit, Scamio est un atout pour ne plus tomber dans le piège du phishing // Source : Vitaly Gariev via Unsplash

cyberguerre hygiène numérique données personnelles

Scamio : ce chatbot gratuit vous signale en un clic si un message ou un site est une arnaque

18.05.2024 08:31

sponso

tech smartphone smartphones android

Android 15 : date de sortie, nouveautés, installation, téléphones compatibles… tout ce que l’on sait

17.05.2024 16:03

tech smartphone smartphones android

Pourquoi Android n’est plus la priorité de Google

17.05.2024 15:49

Dyson Gen5 Detect Absolute // Source : Dyson

tech

Dyson Gen5 Detect Absolute : cet aspirateur balai ultra premium est enfin moins cher

17.05.2024 15:20

Le « pacte nickel » remis en cause

Le nickel, source de tension en Nouvelle-Calédonie // Source : Wikimédia Commons / Canva / Montage Numerama

Le nickel, élément clé des voitures électriques et smartphones qui attise les tensions en Nouvelle-Calédonie

17.05.2024 13:40

tech web réseaux sociaux

ChatGPT va pouvoir puiser sans limites dans les publications Reddit

17.05.2024 13:09

Découvrez les bonus Numerama+

Il y a une bonne raison de ne pas s'abonner à Numerama+

Découvrez les bonus

Il y a une bonne raison de ne pas s'abonner à