Twitter va progressivement déployer une nouvelle option sur le réseau social qui permet de bloquer automatiquement des comptes, en cas de comportement inapproprié. Cette initiative s’ajoute à la longue liste des actions lancées par la plateforme pour en finir avec certains contenus ou propos offensants.

C’est par un message publié sur sa plateforme, forcément, que Twitter a annoncé la nouvelle, le 1er septembre 2021. À compter de ce jour, les membres du réseau social vont accéder progressivement à un nouveau mécanisme, appelé Safety Mode (Mode de Sécurité). Son rôle ? Laisser à Twitter le soin de bloquer automatiquement des comptes qui semblent dépasser les bornes.

Pour qui suit l’actualité de la plateforme, cette option doit être familière : elle avait été présentée en début d’année à l’occasion du Virtual Analyst Day, évènement au cours duquel le site communautaire a levé le voile sur plusieurs fonctionnalités à venir, comme les abonnements Super Follow. Dans les grandes lignes, il s’agit, selon Twitter, « de limiter les interactions indésirables ». Et, en fait, surtout inamicales.

Safety Mode Twitter

Safety Mode.

Source : Twitter

Parmi les signaux utilisés, Twitter évoque l’emploi de certaines formules (des insultes ou des remarques haineuses) et l’envoi de réponses ou de mentions répétitives et non sollicitées. Sont aussi prises en compte les éventuelles interactions passées entre les deux comptes en cause. Il s’agit de faire en sorte d’éviter de bloquer des personnes avec qui vous échangez, même si vous ne les suivez pas.

« Les auteurs de tweets jugés nuisibles ou non sollicités par notre technologie seront automatiquement bloqués, ce qui signifie qu’ils ne pourront temporairement plus suivre votre compte, voir vos tweets ou vous envoyer des messages directs », ajoute la société. Le dispositif, pour le moment réservé à certains comptes réglés sur la langue anglaise, sera déployé aussi bien sur Android qu’iOS.

Risque de faux positifs

La société admet que le système pourra générer parfois de faux positifs. Elle prévoit donc un système interne pour voir qui est temporairement bloqué. En outre, le Safety Mode peut être suspendu à tout moment. Reste à savoir si les internautes auront vraiment le temps et l’envie de faire ces vérifications. Peut-être préféreront-ils laisser la technique, malgré ses défauts, faire le job.

Inutile toutefois de se précipiter dans les paramètres de Twitter pour activer le Safety Mode : l’option est pour l’instant proposée à un petit nombre d’internautes, afin de pouvoir faire un maximum d’ajustements avant un déploiement plus large. « Dans les mois à venir, nous testerons ce mode avec un petit groupe de personnes sur Twitter et nous élargirons le groupe de bêta-testeurs, à mesure des retours », écrit la société.

Logo de Twitter. // Source : Nino Barbey pour Numerama

Logo de Twitter.

Source : Nino Barbey pour Numerama

Des tests étaient déjà en cours en interne et auprès de certains publics particuliers. Des échanges ont aussi eu lieu avec des organisations en charge des libertés individuelles et des problématiques de santé mentale. Ces nouveaux essais doivent servir à poursuivre la bonne calibration du dispositif, qui reposera sur l’informatique pour détecter les comportements inappropriés et les bloquer pendant sept jours.

Il reste à voir quel sera l’impact de ce dispositif sur les interactions. Les plus pessimistes diront sans doute que cette tentative ne va pas bouleverser la situation : cela fait des années que Twitter se démène pour en finir avec les contenus offensants et les attitudes haineuses ou hostiles. Or, au regard des controverses régulières sur le site, force est de constater qu’il n’a jamais trouvé la recette magique.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !