Un étudiant anonyme a développé un inquiétant site internet. Nommé Faces of the Riot, le site repéré par Wired ce 20 janvier 2021 expose plus de 6 000 visages de supposés participants à l’assaut du Capitole, initié par Donald Trump le 6 janvier 2021.

Particulièrement rudimentaire, cette sorte d’annuaire affiche 60 images par page. Sous chacune d’entre elles se trouve un identifiant, celui de la vidéo publiée sur Parler d’où elle est extraite. Si l’on clique sur l’image, cette vidéo s’ouvre : la fonctionnalité a pour objectif de remettre l’image dans son contexte.

Côté texte, la page se contente d’un message d’avertissement, en majuscules : « N’ESSAYEZ PAS DE MENER VOTRE PROPRE ENQUÊTE SUR UNE PERSONNE AFFICHÉE SUR LE SITE. SIGNALEZ-LES AU FBI PAR CE LIEN À LA PLACE. MERCI. »

Image d'erreur

Le Capitole, vu par Satellite // Source : Google Earth

Ce texte résume à lui seul le dangereux jeu d’équilibriste auquel se livre l’étudiant. Interrogé par Wired, il défend que « toutes les personnes qui ont participé à cet acte violent, qui s’apparente à une insurrection, doivent être tenues responsables ». Il a donc créé un outil pour les exposer, tout en ayant en partie conscience des usages abusifs que permet un tel projet.

Malgré sa volonté de bien faire, l’apprenti développeur s’essaie à un exercice compliqué, alourdi par des approximations techniques et des garanties insuffisantes. Et il fait un exemple malgré lui, les dérives des usages des technologies de détections faciales.

Des données personnelles accessibles publiquement

Pour récupérer les 6 000 visages, l’étudiant a traité les vidéos de l’assaut du Capitole publiées sur Parler, le réseau social repère des pro-Trump. Car oui, les participants de l’invasion, pourtant illégale et punissable par la justice, ont publié plus de 800 vidéos de l’attaque — mais aussi du meeting qui l’a précédé — sur la plateforme. Autrement dit, ils ont eux-mêmes créé une mine d’information truffée de preuves susceptibles de mener à leur arrestation. Et puisqu’ils ne portaient pas de masques malgré le contexte sanitaire, ils sont facilement reconnaissables.

Peu après l’événement historique, Amazon Web Services, l’hébergeur de Parler, a débranché le réseau social. Mais une hackeuse a organisé la sauvegarde en urgence de l’intégralité des plus de 50 To de contenus du réseau social. Pour y parvenir, elle a profité de l’absence de protections élémentaires du site et de l’aide d’une association dédiée à ce genre d’opération de sauvegarde. D’autres, comme l’artiste Kyle McDonald, ont publié un travail de sauvegarde similaire, mais concentré sur les vidéos de la journée du 6 janvier. Les enquêteurs, professionnels comme amateurs, n’ont donc pas eu besoin d’attendre le retour en ligne de Parler pour se pencher sur la reconstitution des événements.

Image d'erreur

Le tri effectué par l’étudiant est bien trop grossier : on y retrouve des images floues, des doublons, et surtout des images en dehors du Capitole. // Source : Faces of The Riot

Le créateur de Faces of the Riot fait partie de ceux qui ont récupéré le jeu de données de McDonald. Il a décidé de s’en servir pour tester des outils de détection faciale. Il a donc utilisé un outil pour détecter plus de 200 000 visages sur les 11 heures de vidéos, puis un second pour éliminer les doublons, et n’obtenir que des visages uniques. Sauf que son tri est loin d’être parfait, et le développeur en a conscience : le site compte des doublons, des images de protestants qui n’ont participé qu’à la manifestation en dehors du Capitole, des visages de policiers, ou encore des images… d’objets. Bref, la présence d’une personne dans la base est loin d’être synonyme de participation au vandalisme des lieux. Comme seule modération, le créateur du site propose de le contacter sur Twitter dans le cas où une image ne serait « pas un visage, pas un manifestant, etc… ».

À lui seul, avec l’aide d’un ami, de corriger manuellement la base de données et donc de décider si une personne mérite où non sa place parmi les « émeutiers ».

Avec des garanties techniques insuffisantes, la bonne foi ne suffit pas

Le créateur répète que son initiative vise seulement à appuyer les enquêtes ouvertes des forces de l’ordre, en facilitant l’identification des protagonistes. Mais il ouvre aussi la porte doxing, cette pratique qui consiste à publier des données personnelles dans le but de nuire. Les autorités américaines ont largement les moyens de construire un projet similaire (sans les défauts) si elles le souhaitent, et n’ont vraisemblablement pas besoin de ce genre d’initiative individuelle.

Quand bien même l’exécution du projet serait parfaite, ce n’est pas parce qu’elle vise des émeutiers hors-la-loi qu’elle peut balayer tous les enjeux éthiques (certes moins présents aux États-Unis qu’en France) sur le traitement des images. Si cette fois le projet a un objectif en apparence vertueux, un prochain futur pourrait viser des minorités discriminées, déjà maltraitées par ce genre de technologie. Plusieurs grandes entreprises américaines ont arrêté de recourir aux technologies de reconnaissance faciale en raison des trop nombreuses dérives, ce n’est pas pour que des individus isolés s’octroient le droit de manipuler et d’afficher ces données personnelles.

Le créateur a beau arguer que son site ne comporte pas de moteur de recherche d’image qui permettrait de chercher un visage à partir d’une photo, ce n’est pas une garantie suffisante. Finalement, le projet expose les limites de la détection d’image, et quel genre de projet un développeur débutant peut créer. De quoi inquiéter sur le futur ?

une comparateur meilleur vpn numerama

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !