Pourquoi les captchas sont-ils devenus si compliqués

Il est de plus en plus difficile de prouver que vous n'êtes pas un robot



À un moment donné l'année dernière, les demandes constantes de Google pour prouver que je suis humain ont commencé à sembler de plus en plus agressives. De plus en plus, pour un bouton simple et un peu trop mignon "Je ne suis pas un robot", des demandes ont commencé à apparaître pour le prouver - en sélectionnant tous les feux de circulation, les transitions ou les fenêtres dans la grille d'image. Bientôt, les feux de circulation ont commencé à se cacher dans le feuillage, les transitions ont été déformées et ont tourné au coin de la rue, et les enseignes du magasin sont devenues floues et sont passées au coréen. Il y a quelque chose de très décevant dans les tentatives infructueuses de trouver une bouche d'incendie dans l'image.

Ces tests sont appelés CAPTCHA, acronyme de «test public entièrement automatique de Turing conçu pour faire la distinction entre les personnes et les ordinateurs», et une fois qu'ils ont atteint un degré similaire d'illisibilité. Au début des années 2000, de simples images avec du texte étaient suffisantes pour arrêter la plupart des robots de spam. Dix ans se sont écoulés et après que Google a acheté le programme à des chercheurs de l'Université Carnegie Mellon et l'ait utilisé pour numériser dans le projet Google Books, les textes ont dû être déformés et cachés de plus en plus pour dépasser les programmes d'amélioration de la reconnaissance optique des caractères - les programmes mêmes qui a aidé à améliorer les personnes mêmes qui devaient résoudre tous ces captcha.

Étant donné que CAPTCHA est un outil élégant pour la formation de l'IA, tout test inventé ne peut durer qu'un certain temps, ce que ses inventeurs admettent. Avec tous ces chercheurs, escrocs et gens ordinaires résolvant des milliards de puzzles au bord de ce qui est possible pour l'IA, à un moment donné, les machines ont simplement dû nous dépasser. En 2014, Google a opposé son meilleur algorithme pour résoudre les textes et les personnes les plus déformés: l'ordinateur a correctement reconnu le texte dans 99,8% des cas, et les personnes dans seulement 33% .

Après cela, Google est passé à NoCaptcha ReCaptcha , qui surveille le comportement des gens et collecte leurs données, ce qui permet à certains d'aller plus loin en cliquant simplement sur le bouton "Je ne suis pas un robot", tandis que d'autres leur confient des tâches pour rechercher les images que nous voyons aujourd'hui. Mais les voitures nous dépassent encore. Tous ces auvents, qui peuvent être ou non des vitrines, sont l'ultime étape de la course aux armements et aux personnes.

Jason Polakis, professeur d'informatique à l'Université de l'Illinois à Chicago, est personnellement responsable de la récente complication du captcha. En 2016, il a publié un travail dans lequel il a utilisé des programmes de reconnaissance d'images prêts à l'emploi, y compris la propre recherche d'images de Google, pour résoudre la précision du captcha de 70%. D'autres chercheurs ont traité de la reconnaissance du captcha audio de Google à l'aide de programmes de reconnaissance vocale de l'entreprise elle-même.

L'apprentissage automatique n'est pas pire que les humains pour reconnaître des textes, des images et des voix simples, explique Polakis. Les algorithmes, peut-être, font encore mieux: «Nous avons atteint le point où la complication des tâches pour les logiciels conduit au fait que les tâches deviennent excessivement compliquées pour les gens. Nous avons besoin d'une alternative, mais il n'y a pas encore de plan clair. »

La littérature CAPTCHA est pleine de faux départs et d'étranges tentatives pour trouver autre chose que du texte et des images, ce que tout le monde fait bien et les voitures mal. Les chercheurs ont essayé de proposer aux utilisateurs de trier les images des personnes par expression faciale, sexe et origine ethnique (vous pouvez imaginer comment cela s'est passé). Il y avait des suggestions pour organiser le captcha avec des quiz, captcha basé sur des berceuses , commun dans les endroits où, comme prévu, l'utilisateur a grandi. Ces captcha avec une référence culturelle sont destinés non seulement aux robots, mais aussi aux personnes d'autres pays qui décident de captcha pour un sou. Les gens ont essayé de conduire les algorithmes de reconnaissance d'image dans une impasse, invitant l'utilisateur à identifier, par exemple, un cochon, mais en même temps dessiné et dans des lunettes de soleil. Les chercheurs ont exploré des options telles que l'invitation des utilisateurs à reconnaître des objets dans un hachage de kaléidoscope . Dans l'une des options intéressantes de 2010, les chercheurs ont suggéré d'utiliser le captcha pour trier les anciens pétroglyphes - les ordinateurs ne reconnaissent pas correctement les croquis ou les images de cerfs sur les parois des grottes.

Récemment, il y a eu des tentatives pour développer des captchas de jeu où l'utilisateur doit faire pivoter des objets à des angles spécifiques ou déplacer des pièces de puzzle, et les instructions pour résoudre le captcha n'étaient pas données sous forme de texte, mais sous forme de symboles, ou étaient impliquées par le contexte du terrain de jeu. L'espoir est que les gens comprendront la logique du puzzle et que les ordinateurs trébucheront sans instructions claires. D'autres chercheurs ont essayé d'utiliser le fait que les gens ont un corps et ont utilisé des appareils photo ou de la réalité augmentée pour confirmer interactivement la présence d'une personne.

Le problème avec beaucoup de ces tests n'est pas que les robots sont trop intelligents, mais que les gens ne s'en sortent pas bien. Et ce n'est pas que les gens sont stupides; ils varient simplement considérablement en termes de langue, de culture et d'expérience. Après s'être débarrassé de tout cela pour faire un test que n'importe qui peut passer sans formation et sans longue délibération, nous nous retrouvons avec des tâches aussi grossières que la reconnaissance d'image - et c'est exactement ce que l'IA spécialement adaptée fera bien.

«Les tests sont limités par les capacités humaines», explique Polakis. - Il ne s'agit pas seulement de capacités physiques - vous devez trouver quelque chose d'interculturel, d'interlangue. Nous avons besoin d'une tâche qui fonctionne bien avec une personne de Grèce, avec une personne de Chicago, avec une personne d'Afrique du Sud, d'Iran et d'Australie en même temps. Et cela ne devrait pas dépendre des nuances et des différences culturelles. Nous avons besoin d'une tâche que la personne moyenne gère bien, elle ne devrait pas être limitée à un sous-groupe spécifique de personnes, et elle devrait être difficile pour un ordinateur. Tout cela limite considérablement le choix des options. Et cela devrait aussi être quelque chose que les gens gèrent rapidement, et ce n'est pas très ennuyeux. "

Les tentatives pour résoudre ces énigmes avec des images floues transfèrent rapidement une personne sur des rails philosophiques: existe-t-il une qualité humaine universelle qui peut être démontrée à une machine et que la machine ne peut pas imiter? Que signifie être humain?

Peut-être que notre humanité ne se mesure pas à la façon dont nous effectuons les tâches, mais à la façon dont nous nous comportons, nous déplaçant à travers le monde - ou, dans ce cas, à travers Internet. Captcha de jeu, captcha vidéo, tout captcha que vous pouvez trouver sera piraté, explique Shuman Ghosemajumder, l'équipe d'automatisation anti-clic de Google, qui est devenu plus tard le directeur technologique de Shape Security pour la détection des robots. Il a tendance à «l'autorisation permanente» au lieu de tests individuels - pour surveiller le comportement des utilisateurs et rechercher des signes d'automatisation. «Une vraie personne ne maîtrise pas très bien la motricité et ne peut pas déplacer la souris de la même manière plusieurs fois au cours de plusieurs interactions, même si elle essaie de le faire», explique Gosmahumder. Le robot interagira avec la page sans déplacer la souris, ni la déplacer très précisément, et dans les actions d'une personne, il y aura une «entropie» difficile à simuler, explique Gosmahumder.

La propre équipe de captcha de Google travaille dans une direction similaire. La dernière version de reCaptcha v3 , qui a été annoncée à la fin de l'année dernière, utilise une «analyse adaptative des risques» pour évaluer le trafic en cas de suspicion; les propriétaires de sites peuvent proposer aux utilisateurs suspects des tâches telles que la saisie d'un mot de passe ou une autorisation à deux facteurs. Google ne divulgue pas quels facteurs sont pris en compte dans les estimations, sauf que l'entreprise évalue à quoi ressemble le «bon trafic» sur le site et utilise ces informations pour filtrer le «mauvais trafic», selon Cy Khormaee, chef de produit de l'équipe CAPTCHA. Les chercheurs en sécurité disent qu'il s'agit probablement d'un mélange de cookies, d'attributs de navigateur, de modèles de trafic et d'autres facteurs. Un inconvénient du nouveau modèle de reconnaissance de robot est que la navigation sur le Web en essayant de minimiser les observations des utilisateurs peut être un peu ennuyeuse, car des choses comme les VPN et les extensions qui rendent difficile le suivi d'un utilisateur peuvent être suspectes.

Aaron Malenfant, ingénieur principal de Google pour l'équipe CAPTCHA, a déclaré que s'éloigner des tests de Turing devrait aider à contourner la concurrence que les gens perdent tout le temps. «Plus nous investissons dans l'apprentissage automatique, plus ces tâches deviendront difficiles pour les personnes, et c'est notamment pourquoi nous avons lancé CAPTCHA V3 - pour prendre de l'avance sur cette courbe.» Malenfant dit qu'après 5 à 10 ans, les tâches dans le captcha n'auront plus aucun sens. La plupart du Web dépendra du test constant et caché de Turing exécuté en arrière-plan.

Dans son livre «L'homme le plus humain», Brian Christian participe au test de Turing en tant que leurre et se rend compte qu'il est très difficile de prouver son humanité dans les conversations. D'un autre côté, les développeurs de robots ont constaté que ces tests sont faciles à passer sans prétendre être un interlocuteur éloquent ou intelligent, mais répondre à des questions avec des blagues illogiques, faire des fautes de frappe ou, comme dans le cas d'un bot qui a remporté le concours de Turing en 2014 , affirmant que vous êtes un garçon ukrainien de 13 ans qui ne parle pas bien l'anglais. Après tout, c'est la nature humaine de faire des erreurs. Il est possible que le captcha attende un tel avenir, le test de Turing le plus courant au monde - la nouvelle course aux armements ne créera pas des robots supérieurs aux gens pour trier les images et analyser le texte, mais des robots qui font des erreurs, manquent les boutons, sont distraits et changent d'onglet. "Je pense que les gens commencent à comprendre qu'il existe des domaines d'application pour simuler l'utilisateur humain moyen ... ou des gens stupides", explique Gosmakhumder.

Les CAPTCHA peuvent persister dans ce monde. En 2017, Amazon a déposé un brevet pour un système qui utilise des illusions d'optique et des puzzles logiques difficiles à manipuler. Ce test est appelé «test d'erreur de Turing» et la seule façon de le réussir est de donner la mauvaise réponse.

Source: https://habr.com/ru/post/fr439500/


All Articles