Le test du CAPTCHA, qui vise à différencier une machine d'un humain, est-il encore pertinent pour tenir à distance les robots informatiques spécialisés dans le spam ? Google indique en effet que les derniers progrès en la matière permettent à un ordinateur de répondre correctement dans plus de 99 % des cas.

Ce n'était sans doute qu'une question de temps. Créé initialement pour empêcher la propagation du spam sur les sites web, le CAPTCHA est désormais résolu plus efficacement par un ordinateur que par un humain. C'est en tout cas le constat qu'a fait Google, puisque l'entreprise signale que des algorithmes sont en mesure de déchiffrer les caractères du CAPTCHA avec un taux de réussite supérieur à 99 %.

En principe, le test du CAPTCHA doit servir à différencier une machine d'un humain. L'idée est de présenter à l'écran une suite de caractères plus ou moins déformés que seul l'usager est censé reconnaître, afin de tenir à l'écart les robots conçus pour répandre des messages indésirables. En effet, avec le CAPTCHA, la publication d'un commentaire est conditionnée au fait de renseigner la bonne suite de caractères.

Lorsque le test du CAPTCHA a fait ses premiers pas sur le web, les caractères présentés à l'écran étaient d'une grande lisibilité. Il n'était pas nécessaire de les tordre excessivement ou de rajouter des "leurres" dans l'image pour perturber les robots. Mais avec les progrès de la technique et l'émergence de nouveaux algorithmes de résolution, sans parler de l'aide humaine, il a fallu compliquer le CAPTCHA.

Aujourd'hui, certains tests sont franchement illisibles pour un humain. Entre l'arrivée de nouveaux symboles, l'imbrication des caractères, la présence ponctuelle d'un fond dégradé et l'ajout de "leurres", il faut parfois rafraichir à plusieurs reprises le CAPTCHA pour tomber sur un test accessible. D'où les efforts de Google avec ReCAPTCHA de prendre en compte d'autres critères dans la résolution du test.

Pour Google, c'est évident : le fait de retranscrire les caractères d'une image déformée ne devrait pas être le seul facteur à prendre en compte quand il s'agit de déterminer qui est un humain et qui est un robot. D'où la nouvelle approche de Google, qui consiste à faire en sorte que l'efficacité du CAPTCHA dépende moins de caractères déformés, mais prenne plus en compte des techniques avancées d'analyse des risques,

( photo : CC BY-SA Bekathwia )


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.