Je ne suis pas un robot, vraiment ? Un réseau neuronal a résolu certains CAPTCHA

Une intelligence artificielle est parvenue à résoudre l’un des tests pour différencier l’humain de la machine : le CAPTCHA. En utilisant la probabilité, ce réseau neuronal arrive à « comprendre » le texte de ce test, et identifie les lettres déformées.

Existe-il encore une activité humaine qui n’a pas encore été imitée par les robots ? Ils peuvent marcher (comme nous), obtenir la citoyenneté d’un pays (comme nous), avoir des relations sexuelles (comme nous)… mais aussi résoudre un test présenté par essence comme une manière de les différencier des êtres humains. À présent, une machine a démontré qu’elle pouvait passer avec succès l’épreuve du CAPTCHA.

Vous avez probablement déjà passé ce test, au moment de vous inscrire à un service en ligne : il consiste, la plupart du temps, à cocher une case stipulant que vous n’êtes pas un robot, à recopier des lettres tordues, floues ou barrées, voire à sélectionner dans un puzzle d’images celles qui représentent un bus (ou n’importe quel autre objet).

« Je ne suis pas un robot » : vraiment ?

Sa dénomination complète est « Completely Automated Public Test to Tell Computers and Human Apart », que l’on pourrait traduire en français par le « Test de Turing complètement automatique permettant de différencier les humains des ordinateurs. » Chez Google, le CAPTCHA ressemble par exemple à l’image suivante.

Google reCAPTCHA

Ironie du sort, la phrase « I’m not a robot » ne serait plus si véridique que cela. À en croire les travaux des psychologues cognitivistes Stanislas Dehaene, Hakwan Lau et du neuroscientifique Sid Kouider, une intelligence artificielle s’est montrée capable de résoudre certains types de CAPTCHA.

Leur étude, consultable dans la revue scientifique Science, précise que l’IA en question a réalisé cette performance avec une précision de 66,6 %. À titre de comparaison, les scientifiques précisent que les êtres humains peuvent résoudre le même CAPTCHA avec une précision de 87 % — un score expliqué par les divergences d’interprétations.

Cette IA a résolu un CAPTCHA avec une précision proche de celle des humains

Un CAPTCHA est considéré comme inefficace à partir du moment où une machine parvient à le résoudre avec une précision de 1 %. La force du CAPTCHA repose sur la capacité du cerveau humain à apprendre et généraliser à partir d’un nombre réduit d’exemples : si vous reconnaissez presque toujours la lettre « M » déformée d’un millier de façons différentes, un ordinateur n’est pas supposé faire de même.

Un réseau neuronal récursif

Or, l’algorithme développé par Vicarious, une entreprise spécialisée dans l’IA et notamment financée par Mark Zuckerberg, a montré qu’il était capable, lui aussi, de généraliser à partir d’un petit nombre d’exemples. Ainsi, la technologie peut résoudre une diversité de CAPTCHA, notamment textuels. Ce « réseau neuronal récursif » intègre la notion de probabilité et analyse le CAPTCHA qui lui est présenté, à partir d’une base d’images contenant un texte sans déformation.

La particularité de ce réseau neuronal est de s’approcher de la manière dont un humain lirait le test : en générant des modèles à partir de ces lettres non déformées, il utilise ensuite la probabilité pour reconnaître les lettres déformées d’un CAPTCHA. Plutôt que d’être entraîné avec des millions de CAPTCHA différents, ce réseau neuronal crée lui-même des modèles de caractères, basés sur la forme et l’apparence des lettres.

Autrement dit, cette IA a la faculté de faire comme un être humain : elle comprend un CAPTCHA. Les ordinateurs seraient-ils désormais plus efficaces que nous pour résoudre ce test censé nous différencier d’eux ?

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

En direct de la rubrique Etude