Os sistemas de visão de máquina podem reconhecer rostos no mesmo nível das pessoas e até criar rostos artificiais realistas. Mas os pesquisadores descobriram que esses sistemas não podem reconhecer ilusões de ótica e, portanto, criar novas.

A visão humana é um dispositivo incrível. Embora tenha se desenvolvido em um ambiente específico há milhões de anos, é capaz de tarefas que nunca surgiram nos primeiros sistemas visuais. Um bom exemplo seria ler ou definir objetos artificiais - carros, aviões, sinais de trânsito etc.
Mas o sistema visual tem um conjunto bem conhecido de falhas que percebemos como ilusões de ótica. Os pesquisadores já identificaram muitas opções nas quais essas ilusões levam as pessoas a avaliar incorretamente cor, tamanho, posição relativa e movimento.
As ilusões por si só são interessantes, pois dão uma idéia da natureza do sistema visual e da percepção. Portanto, será muito útil encontrar uma maneira de encontrar novas ilusões que ajudarão a estudar as limitações desse sistema.
Círculos concêntricos?Aqui devemos oferecer um treinamento aprofundado e prático. Nos últimos anos, as máquinas aprenderam a reconhecer objetos e rostos nas imagens e, em seguida, criar imagens semelhantes. É fácil imaginar que um sistema de visão de máquina seja capaz de reconhecer ilusões e criar as suas próprias.
Aqui Robert Williams e Roman Yampolsky, da Universidade de Louisville, em Kentucky, sobem ao palco. Esses caras
tentaram acionar uma coisa dessas , mas descobriram que nem tudo era tão simples. Os sistemas de aprendizado de máquina existentes não são capazes de fornecer suas próprias ilusões de ótica - pelo menos ainda não. Porque assim?
Primeiro, informações gerais. Os recentes avanços na aprendizagem profunda são baseados em dois avanços. O primeiro é a disponibilidade de poderosas redes neurais e alguns truques de software que lhes permitem aprender bem.
O segundo é a criação de grandes bancos de dados marcados em termos de volume, com base nos quais as máquinas podem aprender. Por exemplo, para ensinar uma máquina a reconhecer rostos, são necessárias dezenas de milhares de imagens contendo rostos claramente marcados. Com essas informações, a rede neural pode aprender a reconhecer os padrões característicos dos rostos - dois olhos, um nariz e uma boca. Ainda mais impressionante, um par de redes - o chamado
Rede de geração competitiva (GSS) - capaz de ensinar uns aos outros como criar imagens realistas e completamente artificiais de rostos.
Williams e Yampolsky conceberam ensinar a rede neural a determinar ilusões ópticas. A capacidade de computação é suficiente e não há bancos de dados adequados suficientes. Portanto, sua primeira tarefa foi criar um banco de dados de ilusões de ótica para treinamento.
Acabou sendo difícil de fazer. "Existem apenas alguns milhares de ilusões ópticas estáticas, e o número de tipos únicos de ilusões é muito pequeno - talvez algumas dúzias", dizem eles.
E esse é um sério obstáculo para os modernos sistemas de aprendizado de máquina. "Criar um modelo que possa aprender com um conjunto de dados tão pequeno e limitado será um grande avanço para modelos generativos e uma compreensão da visão humana", afirmam eles.
Portanto, Williams e Yampolsky coletaram um banco de dados com mais de 6.000 imagens de ilusões de ótica e treinaram a rede neural para reconhecê-las. Então eles criaram o GSS, que deveria criar ilusões de ótica de forma independente.
Os resultados os decepcionaram. "Após sete horas de treinamento no Nvidia Tesla K80, nada de valor foi criado", disseram os pesquisadores, que abriram o banco de dados para todo mundo usar.
O resultado, no entanto, é interessante. "As únicas ilusões de ótica conhecidas por nós foram criadas pela evolução (por exemplo, padrões de olhos nas asas de borboletas) ou artistas humanos", destacam. E em ambos os casos, as pessoas tiveram um papel crucial no fornecimento de feedback - as pessoas podem ver a ilusão.
E os sistemas de visão de máquina não podem. "É improvável que o GSS seja capaz de aprender a enganar sua visão sem entender os princípios subjacentes às ilusões", afirma Williams e Yampolsky.
Isso pode ser desafiador, pois existem diferenças críticas entre os sistemas visuais do homem e da máquina. Muitos pesquisadores criam redes neurais que lembram ainda mais o sistema visual humano. Talvez uma das verificações interessantes para esses sistemas seja se eles conseguem ver a ilusão.
Enquanto isso, Williams e Yampolsky não estão otimistas: "Aparentemente, um conjunto de dados com ilusões pode não ser suficiente para criar novas ilusões", dizem eles. Então, por enquanto, as ilusões ópticas continuam sendo um bastião da percepção humana, não sujeitas a máquinas.