Por que os captchas se tornam tão complicados

Está ficando mais difícil provar que você não é um robô



Em algum momento do ano passado, as constantes demandas do Google para provar que sou humano começaram a parecer cada vez mais agressivas. Cada vez mais, para um botão simples e um pouco fofo demais "Não sou um robô", começaram a surgir demandas para provar isso - selecionando todos os semáforos, transições ou janelas na grade de imagens. Logo, os semáforos começaram a se esconder na folhagem, as transições foram distorcidas e deram a volta na esquina, e as placas da loja ficaram embaçadas e mudaram para coreano. Há algo muito decepcionante nas tentativas frustradas de encontrar um hidrante na imagem.

Esses testes são chamados CAPTCHA, um acrônimo para "teste público totalmente automático de Turing projetado para distinguir entre pessoas e computadores", e uma vez que atingiram um grau semelhante de ilegibilidade. No início dos anos 2000, imagens simples com texto eram suficientes para interromper a maioria dos bots de spam. Dez anos se passaram, e depois que o Google comprou o programa de pesquisadores da Universidade Carnegie Mellon e o usou para digitalizar no projeto Google Livros, os textos tiveram que ser distorcidos e ocultos cada vez mais para ultrapassar os programas de reconhecimento óptico de caracteres - os próprios programas que ajudaram a melhorar as pessoas que tiveram que resolver todos esses captcha.

Como o CAPTCHA é uma ferramenta elegante para o treinamento de IA, qualquer teste inventado pode durar apenas um tempo, o que seus inventores admitem. Com todos esses pesquisadores, golpistas e pessoas comuns resolvendo bilhões de quebra-cabeças à beira do que é possível para a IA, em algum momento as máquinas simplesmente tiveram que nos ultrapassar. Em 2014, o Google lançou seu melhor algoritmo para resolver os textos e as pessoas mais distorcidas: o computador reconheceu o texto corretamente em 99,8% dos casos e as pessoas em apenas 33% .

Depois disso, o Google mudou para o NoCaptcha ReCaptcha , que monitora o comportamento das pessoas e coleta seus dados, o que permite a alguns deles ir mais longe simplesmente clicando no botão "Eu não sou um robô", enquanto outros dão tarefas para procurar imagens que vemos hoje. Mas os carros estão nos ultrapassando novamente. Todos esses toldos, que podem ou não ser montras, são o estágio final da corrida armamentista de armas e pessoas.

Jason Polakis, professor de ciência da computação na Universidade de Illinois em Chicago, é pessoalmente responsável pela recente complicação do captcha. Em 2016, ele publicou um trabalho no qual utilizava programas de reconhecimento de imagens prontos, incluindo a pesquisa de imagens do próprio Google, para resolver a precisão do captcha de 70%. Outros pesquisadores lidaram com o reconhecimento de captcha de áudio do Google usando programas de reconhecimento de fala da própria empresa.

O aprendizado de máquina não é pior do que os humanos ao reconhecer textos, imagens e vozes simples, diz Polakis. Talvez os algoritmos ainda melhorem: “Chegamos ao ponto em que a complicação de tarefas para software leva ao fato de que as tarefas se tornam excessivamente complicadas para as pessoas. Precisamos de uma alternativa, mas ainda não há um plano claro. ”

A literatura do CAPTCHA é repleta de falsos começos e tentativas estranhas de encontrar algo além de texto e imagens, o que todas as pessoas fazem bem e os carros fazem mal. Os pesquisadores tentaram oferecer aos usuários a classificação das imagens das pessoas por expressão facial, gênero e etnia (você pode imaginar como foi). Houve sugestões para organizar o captcha com questionários, captcha com base em canções de ninar , comuns nos locais em que, como esperado, o usuário cresceu. Esse captcha com uma referência cultural é direcionado não apenas aos robôs, mas também a pessoas de outros países que decidem captcha por um centavo. As pessoas tentaram levar os algoritmos de reconhecimento de imagem a um beco sem saída, levando o usuário a identificar, por exemplo, um porco, mas ao mesmo tempo desenhado e usando óculos escuros. Os pesquisadores exploraram opções como convidar os usuários a reconhecer objetos em um hash de caleidoscópio . Em uma das opções interessantes em 2010, os pesquisadores sugeriram o uso do captcha para classificar petroglifos antigos - os computadores fazem um péssimo trabalho ao reconhecer esboços ou imagens de veados nas paredes das cavernas.

Recentemente, houve tentativas de desenvolver captchas de jogos em que o usuário precisa girar objetos em certos ângulos ou mover peças do quebra-cabeça, e as instruções para resolver o captcha não foram dadas na forma de texto, mas na forma de símbolos, ou foram implícitas no contexto do campo de jogo. A esperança é que as pessoas entendam a lógica do quebra-cabeça e os computadores tropecem sem instruções claras. Outros pesquisadores tentaram usar o fato de que as pessoas têm corpos e usaram câmeras de dispositivos ou realidade aumentada para confirmar interativamente a presença de uma pessoa.

O problema com muitos desses testes não é que os robôs sejam muito inteligentes, mas que as pessoas não se saem bem com eles. E não é que as pessoas sejam burras; eles simplesmente variam muito em idioma, cultura e experiência. Tendo nos livrado de tudo isso para fazer um teste que qualquer um pode passar sem treinamento e muita reflexão, ficamos com tarefas rudes como reconhecimento de imagem - e é exatamente isso que a IA especialmente adaptada fará bem.

"Os testes são limitados pelas capacidades humanas", diz Polakis. - Não se trata apenas de capacidades físicas - você precisa encontrar algo intercultural, interlíngua. Precisamos de uma tarefa que funcione bem com uma pessoa da Grécia, com uma pessoa de Chicago, com uma pessoa da África do Sul, Irã e Austrália ao mesmo tempo. E não deve depender de nuances e diferenças culturais. Precisamos de uma tarefa com a qual a pessoa comum lida bem, não deve ser limitada a um subgrupo específico de pessoas e deve ser difícil para um computador. Tudo isso limita muito a escolha das opções. E também deve ser algo com que as pessoas lidam rapidamente, e isso não é muito irritante ".

As tentativas de resolver esses enigmas com imagens borradas transferem rapidamente uma pessoa para trilhos filosóficos: existe alguma qualidade humana universal que possa ser demonstrada para uma máquina e que a máquina não pode imitar? O que significa ser humano?

Talvez nossa humanidade seja medida não pela maneira como realizamos tarefas, mas pela forma como nos comportamos, movendo-nos pelo mundo - ou, neste caso, pela Internet. O jogo captcha, vídeo captcha, qualquer captcha que você inventar será invadido, diz Shuman Ghosemajumder, equipe de automação anti-clique do Google, que mais tarde se tornou diretor de tecnologia da Shape Security para detecção de robôs. Ele tende a "autorização permanente" em vez de testes individuais - para monitorar o comportamento do usuário e procurar sinais de automação. "Uma pessoa real não controla muito bem as habilidades motoras e não pode mover o mouse da mesma maneira várias vezes durante várias interações, mesmo que tente fazê-lo", diz Gosmahumder. O robô irá interagir com a página sem mover o mouse ou movê-lo com muita precisão, e nas ações de uma pessoa haverá "entropia" difícil de falsificar, diz Gosmahumder.

A própria equipe captcha do Google trabalha em uma direção semelhante. A versão mais recente do reCaptcha v3 , anunciada no final do ano passado, usa "análise de risco adaptativa" para avaliar o tráfego em busca de suspeitas; os proprietários do site podem oferecer tarefas suspeitas aos usuários, como digitar uma senha ou autorização de dois fatores. O Google não divulga quais fatores são levados em consideração nas estimativas, exceto que a empresa avalia a aparência do “tráfego bom” no site e usa essas informações para filtrar o “tráfego ruim”, de acordo com Cy Khormaee, gerente de produto da equipe. CAPTCHA. Pesquisadores de segurança dizem que é provavelmente uma mistura de cookies, atributos do navegador, padrões de tráfego e outros fatores. Uma desvantagem do novo modelo de reconhecimento de robô é que navegar na Web ao tentar minimizar as observações do usuário pode ser um pouco chato, pois coisas como VPNs e extensões que dificultam o rastreamento de um usuário podem ser suspeitas.

Aaron Malenfant, engenheiro líder do Google para a equipe CAPTCHA, diz que se afastar dos testes de Turing deve ajudar a contornar a competição de que as pessoas perdem o tempo todo. “Quanto mais investimos em aprendizado de máquina, mais difíceis essas tarefas se tornam para as pessoas e, em particular, é por isso que lançamos o CAPTCHA V3 - para avançar nessa curva.” Malenfant diz que depois de 5 a 10 anos as tarefas no captcha não farão mais sentido. A maior parte da web dependerá do teste constante e oculto de Turing em execução em segundo plano.

Em seu livro "O homem mais humano", Brian Christian participa do teste de Turing como um engodo e percebe que é muito difícil provar sua humanidade em conversas. Por outro lado, os desenvolvedores de bot descobriram que é fácil passar nesses testes sem pretender ser um interlocutor eloquente ou inteligente, mas respondendo perguntas com piadas ilógicas, fazendo erros de digitação ou, como no caso de um bot que venceu a competição de Turing em 2014 , alegando que você é um garoto ucraniano de 13 anos que não fala bem o inglês. Afinal, é da natureza humana cometer erros. É possível que o captcha aguarde esse futuro, o teste de Turing mais comum do mundo - a nova corrida armamentista não criará robôs superiores às pessoas na classificação de imagens e análise de texto, mas robôs que cometem erros, perdem os botões, distraem e trocam de guia. "Acho que as pessoas estão começando a entender que existem áreas de aplicação para simular o usuário humano médio ... ou pessoas estúpidas", diz Gosmakhumder.

Os CAPTCHAs podem persistir neste mundo. Em 2017, a Amazon registrou uma patente para um esquema que usa ilusões de ótica e quebra-cabeças lógicos difíceis de lidar com as pessoas. Esse teste é chamado de "teste de Turing através de erro" e a única maneira de passar é dar a resposta errada.

Source: https://habr.com/ru/post/pt439500/


All Articles