Vous en tapez régulièrement sur le net pour vous inscrire à un site ou envoyer un formulaire. Ce sont les Captchas. Mais savez-vous ce que le nom veut dire ?

Vous êtes sur le point de vous inscrire à un site, de modifier votre mot de passe ou bien d’effectuer un achat, mais vous avez reçu une instruction vous demandant de réécrire des lettres apparaissant sur une image ou de désigner des images montrant un objet particulier ? C’est ce qu’on appelle un Captcha et ce type de requête est très courant sur le web.

Cette procédure est affublée d’un nom très étrange de prime abord, mais c’est en fait un acronyme anglais. Si on le déplie complètement, cela veut dire « Completely Automated Public Turing test to tell Computers and Humans Apart », soit « Test de Turing public entièrement automatisé pour distinguer les ordinateurs des humains » en français.

C’est le but central du captcha : vérifier qu’à l’origine d’une demande (accéder à un formulaire, changer de mot de passe, etc.) se trouve quelqu’un et non quelque chose. Le but est d’écarter les machines qui sont conçues pour nuire au système, comme déverser du spam dans les boîtes aux lettres — c’est pour cela qu’il est crucial d’empêcher ces robots de créer des comptes.

Sans titre
Un Captcha sur un ordinateur // Source : Adam Donkus

Le nom du Captcha fait référence à Alan Turing, ce mathématicien et informaticien britannique qui a eu un apport considérable dans la conduite de la Seconde guerre mondiale, en aidant à casser le mécanisme d’Enigma dont l’Allemagne nazie se servait pour envoyer des instructions codées à ses forces. On dit que la résolution d’Enigma a permis de raccourcir la guerre de deux ans.

Son nom a aussi servi pour le Prix Turing, remis depuis 1966 par l’ACM (Association for Computing Machinery). Il est considéré comme l’équivalent du prix Nobel, mais en sciences informatiques. C’est en tout cas une distinction extrêmement prestigieuse et forcément très convoitée. Mais c’est surtout pour le « test de Turing » que son nom est passé à la postérité.

Ce test désigne une expérience consistant à voir si les réponses données par une intelligence artificielle sont suffisamment élaborées pour que l’on ne puisse plus les distinguer de celles que donnerait un humain — sans évidemment que l’on sache à l’avance si c’est un humain ou une machine qui répond. En somme, le Captcha est une déclinaison de ce test de Turing.

captcha robot
Le Captcha sert à vérifier que vous n’êtes pas un robot // Source : Gwydion M Williams

Pourquoi des sites utilisent les Captcha ?

La motivation principale concerne la sécurité pour limiter les nuisances sur le web. Des programmes informatiques parcourent le réseau pour envoyer des spams ou tenter de tromper les internautes, afin de récolter des données personnelles, pour vous inciter à acheter des produits douteux, et ainsi de suite.

D’où l’intérêt de sécuriser l’usage des formulaires de contact, l’accès aux espaces de commentaire et d’échange. L’inscription à un forum de discussion, par exemple, est souvent conditionnée à la résolution d’un Captcha, à la validation du compte via un lien envoyé sur le mail et, parfois, à l’approbation de l’administrateur. Contraignant, mais parfois nécessaire.

Des barrières similaires existent sur les formulaires de contact, dans les zones de commentaire sur les blogs ou les sites, mais aussi pour accéder à telle ou telle plateforme — comme les prestataires de mail tels Outlook, Yahoo et Gmail. Ces webmails sont d’ailleurs des cibles récurrentes, car le mail est un outil de premier ordre pour tenter de tromper quelqu’un.

Comment le Captcha fonctionne ?

Il existe plusieurs types de Captcha, qui permettent tous de vérifier et de confirmer que vous n’êtes bel et bien pas un robot. Ce sont des tests très faciles pour les humains (en tout cas, ils sont censés l’être), mais insolubles pour les robots. Mais avec les progrès de l’informatique, c’est l’inverse qui a tendance à se produire : ils sont devenus paradoxalement plus durs à résoudre pour les humains.

Les Captcha les plus courants sont ceux à base de texte. Ils forment une série de textes et de chiffres déformés qu’il faut réécrire avant de valider son inscription dans un site. Parfois, du « bruit parasite » est ajouté dans le fond de l’image, dans le but de fausser la reconnaissance optique des caractères. C’est le cas par exemple avec l’image ci-dessous.

captcha
Les Captcha de texte forment un groupe de chiffres et de lettres // Source : Shinseungback Kimyonghun

Il existe aussi les Captchas d’images, où il faut sélectionner une série de visuels sur la base d’une demande particulière — désignez les photos où l’on voit une voiture, un passage pour piétons ou bien un animal. On peut aussi citer les Captchas de calcul, dans lesquels il faut trouver la réponse à une simple équation mathématique et la noter dans la case prévue à cet effet.

Bien sûr, il peut arriver de se tromper sur une équation ou de ne pas parvenir à identifier les images que le Captcha vous demande. Dans ce cas, il vous sera possible de demander un autre test à l’aide d’une icône qui se trouve généralement à droite ou en bas de votre Captcha. Ou de demander une lecture sonore du Captcha (s’il est basé sur du texte).

Le fait est que l’avenir des Captchas est peut-être compté. Face aux capacités de plus en plus importantes des systèmes pour contourner ces dispositifs, des sociétés comme Google et Apple ont développé des stratégies (le premier avec reCaptcha, le second avec Privacy Access Token) qui permettent de distinguer les humains et les robots en se basant sur d’autres signaux.