Usar una forma innovadora para distinguir entre personas y bots en Internet plantea una serie de problemas seriosSorprendentemente, se necesita mucho esfuerzo para garantizar que los sitios web puedan asegurarse de que el usuario no sea un robot. Por esta razón, al ingresar a los sitios, a menudo puede ver preguntas del sistema CAPTCHA: fotos borrosas de cruces peatonales, semáforos y escaparates que se propone identificar con unos pocos clics del botón del mouse.
Hay varios tipos de tareas: desde cartas vagas que necesitan ser reconocidas e ingresadas en el campo, hasta consignas de la compañía
como "Comfort Plus" en el sitio web de Delta , como si el estado deplorable del transporte aéreo moderno aún no fuera lo suficientemente anti-utópico. Sin embargo, el más común es el servicio reCAPTCHA de Google,
cuya tercera versión se lanzó a fines de 2018 . Su tarea es reducir significativamente el número de acciones requeridas por el usuario al ingresar al sitio, lo que se logra asignando a los usuarios calificaciones no visualizables dependiendo de cuán "humano" sea su comportamiento. Al final, la tarea inicial de CAPTCHA fue eliminar las cuentas de bot que pueblan sitios web con fines poco honestos.
Pero el sistema innovador desarrollado por los especialistas de Google tiene un inconveniente: la nueva versión rastrea cada movimiento del usuario en el sitio web, por lo que determina si realmente es una persona.
Traducido a Alconost
Fuente: Alexey Bezrodny / iStock / Getty Images Plus¿Mejora necesaria?
Antes de ver cómo funciona este nuevo producto, es útil saber de dónde viene. El nuevo reCAPTCHA reemplazó la tecnología web relativamente antigua, que se utilizó no solo para proteger los sitios.
La herramienta CAPTCHA, que significa "una prueba pública de Turing totalmente automatizada para distinguir entre computadoras y personas", apareció por primera vez a finales de los 90: fue
desarrollada por un equipo de uno de los primeros motores de búsqueda: AltaVista . Antes de eso, era bastante fácil escribir un bot que se registrara automáticamente en el servicio y enviara comentarios de spam en miles. La solución AltaVista se basó en las recomendaciones del manual de la impresora para la prevención del mal reconocimiento óptico de caracteres (OCR); El texto borroso característico del sistema CAPTCHA fue hecho especialmente de tal manera que era difícil de leer por una computadora, pero fácil para una persona, y esto permitía filtrar los bots.
A principios de la década de 2000, estas pruebas estaban en todas partes. Luego vino reCAPTCHA, desarrollado por investigadores de Carnegie Mellon y comprado por Google en 2009, que utilizó la misma idea, pero de una nueva manera: al ingresar el texto de verificación, los usuarios deben identificar ciertas palabras que los programas no pueden reconocer. Es decir, el programa escanea el texto y marca palabras que no puede reconocer. En las pruebas reCAPTCHA, estas palabras se colocan al lado de las palabras conocidas; de esta forma, el usuario verifica una palabra conocida y luego ayuda a identificar una nueva.
Para 2011,
Google había digitalizado todo el archivo del
New York Times solo con las pruebas reCAPTCHA. Los usuarios reconocieron el texto de los escaneos de periódicos por una palabra borrosa a la vez, lo que finalmente permitió digitalizar el catálogo de periódicos y organizar una búsqueda en él. Al crear una herramienta conveniente para proteger los sitios de los bots, Google pudo atraer a las personas para que hicieran su propio trabajo tedioso.
No puede negarse a usar reCAPTCHA: está obligado a aceptar el seguimiento o dejar de usar el sitio que necesita.Habiendo logrado tales resultados, en 2014 reCAPTCHA cambió a mostrar imágenes de la aplicación Google Street View. Después de hacer clic en el botón "No soy un robot", es posible que se le pida que determine cuál de las nueve imágenes contiene "bicicletas" o "farolas". Paralelamente, Google redujo la frecuencia con la que se pedía a los usuarios que verificaran; esto se logró
gracias al análisis de comportamiento : ahora reCAPTCHA puede funcionar en segundo plano y realizar un seguimiento de cómo usamos los sitios web.
Si su computadora tiene una cookie de Google o usa el mouse y el teclado en la página para que no parezca un bot, no se le pedirá que tome la prueba de Street View. Pero algunos usuarios que se preocupan por la privacidad se quejaron de que después de eliminar las cookies y mientras se visualiza en modo de incógnito
, el número de pruebas reCAPTCHA que se ofrecen para pasar
aumenta considerablemente .
Los usuarios también notaron que cuando se trabajaba en navegadores competidores con Google Chrome, como Firefox, se requerían más pruebas, y esto naturalmente plantea la pregunta: ¿se usa reCAPTCHA para fortalecer el dominio del navegador de Google?
Esto plantea serias preocupaciones de privacidad, especialmente porque los principales ingresos de Google provienen de un negocio de publicidad que se basa en el seguimiento de datos. Puede ser inquietante que reCAPTCHA sea esencialmente una herramienta de seguimiento publicitario que se esconde en sitios regulares, como el mismo botón Me gusta de Facebook incorporado en las páginas web.
Punto de vista de Google
Para usar la última versión de reCAPTCHA, los
desarrolladores deben incluir etiquetas de seguimiento en tantas páginas del sitio web como sea posible; esto brinda la oportunidad de obtener una mejor imagen de las acciones de los usuarios. Sin embargo, esta herramienta no existe en el vacío: por ejemplo, también existe Google Analytics, una plataforma que ayuda a los desarrolladores y vendedores a comprender cómo los visitantes usan un sitio web. Es una excelente herramienta utilizada en más de
100,000 de los 1 millón de sitios web más visitados según la versión Construida con , pero al mismo tiempo es parte de una estrategia para rastrear los hábitos de los usuarios en Internet.
La nueva versión de reCAPTCHA completa las partes faltantes de esta imagen y permite que Google penetre aún más, en sitios que no usan Google Analytics. En respuesta a reclamos relevantes, la
compañía le dijo a Fast Company que no recopilaría datos de usuario de reCAPTCHA con fines publicitarios, y que los datos que recopila se utilizan para mejorar el servicio.
Pero estos datos permanecen encerrados en una caja negra incluso para los desarrolladores que implementan esta tecnología en casa.
La documentación de reCAPTCHA no menciona los datos del usuario, ni explica cómo se puede rastrear a los usuarios y dónde se encuentra la información en última instancia, simplemente describe la implementación práctica.
Le pedí a Google que explicara con más detalle qué obligaciones tiene la compañía con respecto a la independencia de reCAPTCHA del negocio de publicidad a largo plazo: el hecho de que no estén conectados ahora no significa que no lo estarán en el futuro.
"Google no utilizará reCAPTCHA para publicidad personalizada".
Una portavoz de Google dijo que "reCAPTCHA solo se puede usar para combatir el spam y el uso indebido de [sitios web]" y que "la API del servicio reCAPTCHA funciona mediante la recopilación de información sobre hardware y software, como datos de dispositivos y aplicaciones, y el envío de estos Datos de Google para análisis. La información recopilada en relación con su uso del servicio se utilizará para mejorar reCAPTCHA y para fines de seguridad general. Google no utilizará reCAPTCHA para publicidad personalizada ".
Esto es genial, y con suerte Google cumplirá su promesa. El problema es que no hay razón para creer que todo será así. La introducción de una tecnología de seguimiento tan poderosa es un paso que debería ser objeto de una gran atención por parte del público, ya que ya hemos visto con qué facilidad las cosas pueden salir mal. Por ejemplo, en 2014 se prometió que WhatsApp seguirá siendo independiente, funcionará por separado de la infraestructura de backend de Facebook, pero
solo dos años después se revisó esta decisión . Cuando Google adquirió Nest, también se nos prometió la independencia, que se
abandonó solo cinco años después : los propietarios de dispositivos tuvieron que cambiar a una cuenta de Google o abandonar algunas funciones.
Google podría crear un servicio como reCAPTCHA, gracias a sus vastos recursos y su amplio alcance, pero esta es también la razón para sospechar que todo irá a peor.
Desafortunadamente, nosotros como usuarios podemos hacer poco. No puede negarse a usar reCAPTCHA: está obligado a aceptar el seguimiento o dejar de usar el sitio que necesita. Si no le gustan los escáneres corporales en los aeropuertos, al menos puede rechazarlos y realizar una búsqueda regular. Pero si el sitio tiene reCAPTCHA, no puede negarse a usarlo.
Si Google tiene la intención de crear tales herramientas teniendo en cuenta el interés público y no su propio beneficio, entonces las empresas deben encontrar formas más convincentes para asegurar a los demás que no cambiarán su palabra cuando sea conveniente. Si quisieran abrir el código fuente del proyecto (como lo fue con
muchos otros productos ), sacarlo de la compañía, o al menos establecer una supervisión de terceros, tal vez este sería un buen comienzo que ayudará a ganar la confianza de los usuarios.
Sobre el traductorEl artículo fue traducido por Alconost.
Alconost
localiza juegos ,
aplicaciones y sitios en 70 idiomas. Traductores nativos, pruebas lingüísticas, plataforma en la nube con API, localización continua, gerentes de proyecto 24/7, cualquier formato de recursos de cadena.
También hacemos
videos de publicidad y capacitación , para sitios que venden, imágenes, publicidad, capacitación, teasers, expliner, trailers de Google Play y App Store.
→
Leer más