Comment rendre les réseaux de neurones artificiels capables de saisir l'ironie de certains messages publiés en ligne ? Des informaticiens du MIT ont inventé un système efficace qui se base sur les emojis, sources d'un contexte émotionnel crucial.

Sur le web, le sarcasme de certains commentaires textuels ou tweets n’échappe pas seulement à une partie des internautes : la capacité des réseaux neuronaux artificiels à le saisir compte parmi les principales difficultés rencontrées dans leur apprentissage.

Des informaticiens du prestigieux Massachusetts Institute of Technology (ou MIT) sont toutefois parvenus à créer un réseau neuronal artificiel capable de percevoir le sarcasme dans des messages grâce aux emojis utilisés par leurs auteurs. Une prouesse éloignée de leur objectif initial, qui consistait à identifier les tweets racistes, mais qui pourrait permettre d’améliorer la modération automatisée de ce type de contenu.

Pour parvenir à créer ce système, intitulé DeepMoji, ils ont recueilli 55 milliards de tweets puis en ont retenu 1,2 milliard contenant au moins un emoji parmi les 64 les plus populaires pour entraîner leur réseau neuronal artificiel. Iyad Rahwan, le professeur du MIT qui a développé DeepMoji en collaboration avec l’un de ses étudiants, Bjarke Felbo, explique : «  Étant donné l’impossibilité d’utiliser une intonation spécifique dans notre voix ou bien notre langage corporel pour contextualiser ce qu’on dit, les emojis sont le moyen de le faire en ligne.  »

Un taux d’identification de 82 %

Grâce au deep learning, DeepMoji a ainsi appris à prédire quel emoji serait utilisé dans tel ou tel message texte, selon le contenu de celui-ci. Le réseau neuronal artificiel a prouvé son efficacité puisqu’il s’est montré plus efficace que certains testeurs en chair et en os. DeepMoji peut en effet se targuer d’une identification réussie à 82 % contre 76 % en moyenne pour les humains mis à contribution.

Les deux informaticiens comptent par ailleurs sur les contributions des internautes, qui peuvent leur soumettre leurs propres tweets et les emojis à y associer sur le site de DeepMoji. Ainsi, lorsqu’on confronte le réseau neuronal artificiel à la phrase « Mon vol est retardé… super ! », il l’associe à différents smileys exprimant l’agacement ou la colère, preuve qu’il a saisi l’ironie du « super ! » de conclusion. Dans le même ordre d’idée, la phrase «  J’aime être facturé pour un service gratuit » est associée à des emojis exprimant l’ironie (pouce levé, sourire…).

En revanche, certaines phrases sont plus dures à appréhender, comme «  j’aime Donald Trump ». DeepMoji y associe quelques smileys (tête de mort, diablotin, cœur) mais avec un faible « taux de confiance », contrairement à la «  confiance modérée » qu’il affiche pour les exemples précédents.

Une avancée importante dans la lutte contre le contenu haineux ?

Kerstin Dautenhahn, professeure spécialisée dans l’étude des interactions entre homme et machine à l’université de Hertfordshire, confie à la BBC : «  C’est une excellente idée d’utiliser des emojis comme étiquettes pour entraîner des réseaux neuronaux. Les appliquer sur des tweets s’avère aussi intelligent, puisque la communication via les tweets est bien plus appauvrie qu’une conversation en face à face, donc les algorithmes ont plus de chances de fonctionner »

L’enjeu d’une compréhension automatisée du sarcasme est de taille, autant pour les réseaux sociaux confrontés à l’épineux casse-tête de la modération des contenus à caractère haineux, que pour les entreprises, soucieuses de pouvoir détecter facilement, à la lecture des messages de leurs clients, si ceux-ci sont mécontents ou non.

Cette avancée pourrait également s’avérer cruciale dans le domaine de la robotique, selon Iyad Rahwan : «  Si les machines sont amenées à coopérer avec nous, il faut qu’elles nous comprennent, et les émotions sont particulièrement difficiles [à appréhender]. »

Partager sur les réseaux sociaux