¿Por qué los captchas se han vuelto tan complicados?

Cada vez es más difícil demostrar que no eres un robot



En algún momento del año pasado, las constantes demandas de Google de demostrar que soy humano comenzaron a parecer cada vez más agresivas. Cada vez más, para un botón simple y demasiado lindo "No soy un robot", comenzaron a aparecer demandas para probar esto, seleccionando todos los semáforos, transiciones o ventanas en la cuadrícula de imágenes. Pronto, los semáforos comenzaron a esconderse en el follaje, las transiciones se distorsionaron y doblaron la esquina, y los letreros de las tiendas se volvieron borrosos y cambiaron al coreano. Hay algo muy decepcionante en los intentos fallidos de encontrar una boca de incendios en la imagen.

Estas pruebas se llaman CAPTCHA, un acrónimo de "prueba pública totalmente automática de Turing diseñada para distinguir entre personas y computadoras", y una vez que alcanzaron un grado similar de ilegibilidad. A principios de la década de 2000, las imágenes simples con texto eran suficientes para detener la mayoría de los robots de spam. Pasaron diez años, y después de que Google compró el programa a investigadores de la Universidad Carnegie Mellon y lo usó para digitalizar en el proyecto Google Books, los textos tuvieron que distorsionarse y ocultarse cada vez más para superar los programas de reconocimiento óptico de caracteres, los mismos programas. quien ayudó a mejorar a las personas que tuvieron que resolver todos estos captcha.

Dado que CAPTCHA es una herramienta elegante para entrenar IA, cualquier prueba inventada solo puede durar un tiempo, lo que admiten sus inventores. Con todos estos investigadores, estafadores y personas comunes resolviendo miles de millones de rompecabezas al borde de lo que es posible para la IA, en algún momento las máquinas simplemente tuvieron que adelantarnos. En 2014, Google enfrentó su mejor algoritmo para resolver los textos y las personas más distorsionados: la computadora reconoció correctamente el texto en el 99.8% de los casos y las personas en solo el 33% .

Después de eso, Google cambió a NoCaptcha ReCaptcha , que monitorea el comportamiento de las personas y recopila sus datos, lo que les permite a algunos ir más allá simplemente haciendo clic en el botón "No soy un robot", mientras que otros les dan tareas para buscar las imágenes que vemos hoy. Pero los autos nos están adelantando nuevamente. Todos estos toldos, que pueden o no ser escaparates, son la etapa final de la carrera armamentista de personas y armas.

Jason Polakis, profesor de informática en la Universidad de Illinois en Chicago, es personalmente responsable de la reciente complicación del captcha. En 2016, publicó un trabajo en el que utilizó programas de reconocimiento de imágenes ya preparados, incluida su propia búsqueda de imágenes de Google, para resolver la precisión de captcha del 70%. Otros investigadores se han ocupado del reconocimiento de captcha de audio de Google utilizando programas de reconocimiento de voz de la propia empresa.

El aprendizaje automático no es peor que el de los humanos para reconocer textos, imágenes y voces simples, dice Polakis. Los algoritmos, tal vez, incluso lo hacen mejor: “Hemos llegado al punto en que la complicación de las tareas para el software lleva al hecho de que las tareas se vuelven excesivamente complicadas para las personas. Necesitamos una alternativa, pero todavía no hay un plan claro ".

La literatura de CAPTCHA está llena de falsos comienzos e intentos extraños de encontrar algo que no sea texto e imágenes, que todas las personas hacen bien y los autos hacen mal. Los investigadores trataron de ofrecer a los usuarios clasificar las imágenes de las personas por expresión facial, género y origen étnico (se puede imaginar cómo fue). Hubo sugerencias para organizar captcha con cuestionarios, captcha basado en canciones de cuna , comunes en aquellos lugares donde, como se esperaba, el usuario creció. Tal captcha con una referencia cultural está dirigido no solo a robots, sino también a personas de otros países que deciden capturar por un centavo. La gente intentó introducir algoritmos de reconocimiento de imágenes en un callejón sin salida, lo que provocó que el usuario identificara, por ejemplo, un cerdo, pero al mismo tiempo dibujado y con gafas de sol. Los investigadores han explorado opciones como invitar a los usuarios a reconocer objetos en un hash de caleidoscopio . En una de las opciones interesantes en 2010, los investigadores sugirieron usar captcha para clasificar petroglifos antiguos : las computadoras hacen un mal trabajo al reconocer bocetos o imágenes de ciervos en las paredes de las cuevas.

Recientemente, ha habido intentos de desarrollar captchas de juegos donde el usuario necesita rotar objetos en ciertos ángulos o mover piezas de rompecabezas, y las instrucciones para resolver el captcha no se dieron en forma de texto, sino en forma de símbolos, o estaban implícitas en el contexto del campo de juego. La esperanza es que la gente entienda la lógica del rompecabezas y las computadoras tropiecen sin instrucciones claras. Otros investigadores trataron de usar el hecho de que las personas tienen cuerpos, y usaron cámaras de dispositivos o realidad aumentada para confirmar interactivamente la presencia de una persona.

El problema con muchas de estas pruebas no es que los robots sean demasiado inteligentes, sino que a las personas no les va bien. Y no es que la gente sea tonta; simplemente varían mucho en idioma, cultura y experiencia. Después de deshacernos de todo esto para hacer una prueba que cualquiera puede pasar sin entrenamiento y sin pensarlo mucho, nos quedan tareas tan groseras como el reconocimiento de imágenes, y esto es exactamente lo que la IA especialmente diseñada hará bien.

"Las pruebas están limitadas por las capacidades humanas", dice Polakis. - No se trata solo de las capacidades físicas: necesita encontrar algo intercultural, interlenguaje. Necesitamos una tarea que funcione bien con una persona de Grecia, con una persona de Chicago, con una persona de Sudáfrica, Irán y Australia al mismo tiempo. Y no debería depender de matices y diferencias culturales. Necesitamos una tarea que la persona promedio haga bien, no debe limitarse a un subgrupo específico de personas y debe ser difícil para una computadora. Todo esto limita en gran medida la elección de opciones. Y también debería ser algo con lo que la gente lidie rápidamente, y eso no es muy molesto ".

Los intentos de resolver estos acertijos con imágenes borrosas transfieren rápidamente a una persona a rieles filosóficos: ¿hay alguna cualidad humana universal que pueda demostrarse a una máquina y que la máquina no pueda imitar? ¿Qué significa ser humano?

Quizás nuestra humanidad se mide no por la forma en que realizamos las tareas, sino por cómo nos comportamos, moviéndonos por el mundo o, en este caso, a través de Internet. El juego captcha, el video captcha, cualquier captcha que se te ocurra será pirateado, dice Shuman Ghosemajumder, el equipo de automatización anti-clic de Google, que más tarde se convirtió en el director de tecnología de Shape Security para la detección de robots. Tiende a la "autorización permanente" en lugar de las pruebas individuales, para monitorear el comportamiento del usuario y buscar signos de automatización. "Una persona real no controla muy bien las habilidades motoras y no puede mover el mouse de la misma manera muchas veces durante varias interacciones, incluso si trata de hacerlo", dice Gosmahumder. El robot interactuará con la página sin mover el mouse o moverlo con mucha precisión, y en las acciones de una persona habrá "entropía" que es difícil de falsificar, dice Gosmahumder.

El propio equipo de captcha de Google trabaja en una dirección similar. La última versión de reCaptcha v3 , que se anunció a fines del año pasado, utiliza un "análisis de riesgo adaptativo" para evaluar el tráfico en busca de sospecha; Los propietarios de sitios pueden ofrecer tareas a usuarios sospechosos como ingresar una contraseña o una autorización de dos factores. Google no revela qué factores se tienen en cuenta en las estimaciones, excepto que la compañía evalúa cómo se ve el "buen tráfico" en el sitio y utiliza esta información para filtrar el "mal tráfico", según Cy Khormaee, gerente de producto del equipo CAPTCHA. Los investigadores de seguridad dicen que probablemente sea una mezcla de cookies, atributos del navegador, patrones de tráfico y otros factores. Un inconveniente del nuevo modelo de reconocimiento de robots es que navegar por la web al tratar de minimizar las observaciones de los usuarios puede ser un poco molesto, ya que cosas como VPN y extensiones que dificultan el seguimiento de un usuario pueden ser sospechosas.

Aaron Malenfant, ingeniero principal de Google para el equipo CAPTCHA, dice que alejarse de las pruebas de Turing debería ayudar a sortear la competencia que las personas pierden todo el tiempo. "Cuanto más invertimos en aprendizaje automático, más difíciles serán estas tareas para las personas y, en particular, es por eso que lanzamos CAPTCHA V3, para adelantarnos a esta curva". Malenfant dice que después de 5-10 años las tareas en el captcha no tendrán ningún sentido. La mayor parte de la web dependerá de la prueba constante y oculta de Turing que se ejecuta en segundo plano.

En su libro "El hombre más humano", Brian Christian participa en la prueba de Turing como señuelo y se da cuenta de que es muy difícil demostrar su humanidad en las conversaciones. Por otro lado, los desarrolladores de bot encontraron que estas pruebas son fáciles de pasar sin pretender ser un interlocutor inteligente o elocuente, sino que responden preguntas con bromas ilógicas, hacen errores tipográficos o, como en el caso de un bot que ganó la competencia de Turing en 2014 , afirman que usted es un niño ucraniano de 13 años que no habla bien inglés. Después de todo, es la naturaleza humana cometer errores. Es posible que el captcha aguarde tal futuro, la prueba de Turing más común en el mundo: la nueva carrera armamentista no creará robots superiores a las personas en la clasificación de imágenes y análisis de texto, sino robots que cometen errores, pierden los botones, se distraen y cambian de pestaña. "Creo que la gente está empezando a comprender que hay áreas de aplicación para simular el usuario humano promedio ... o las personas estúpidas", dice Gosmakhumder.

Los CAPTCHA pueden persistir en este mundo. En 2017, Amazon presentó una patente para un esquema que utiliza ilusiones ópticas y acertijos lógicos que son difíciles de manejar para las personas. Esta prueba se llama "Prueba de error de Turing", y la única forma de aprobarla es dar la respuesta incorrecta.

Source: https://habr.com/ru/post/439500/


All Articles