Los sistemas de visión artificial pueden reconocer caras a nivel de personas e incluso crear caras artificiales realistas. Pero los investigadores descubrieron que estos sistemas no pueden reconocer las ilusiones ópticas y, por lo tanto, crear otras nuevas.

La vista humana es un dispositivo asombroso. Aunque se ha desarrollado en un entorno particular durante millones de años, es capaz de realizar tareas que nunca se encontraron con los primeros sistemas visuales. Un buen ejemplo sería leer o definir objetos artificiales: automóviles, aviones, señales de tráfico, etc.
Pero el sistema visual tiene un conjunto conocido de defectos que percibimos como ilusiones ópticas. Los investigadores ya han identificado muchas opciones en las que estas ilusiones hacen que las personas evalúen incorrectamente el color, el tamaño, la posición relativa y el movimiento.
Las ilusiones per se son interesantes porque dan una idea de la naturaleza del sistema visual y la percepción. Por lo tanto, será muy útil encontrar una forma de encontrar nuevas ilusiones que ayuden a estudiar las limitaciones de este sistema.
Círculos concéntricos?Aquí deberíamos realizar prácticas prácticas de capacitación en profundidad. En los últimos años, las máquinas han aprendido a reconocer objetos y caras en imágenes, y luego crear imágenes similares. Es fácil imaginar que un sistema de visión artificial debería ser capaz de reconocer ilusiones y crear las suyas propias.
Aquí Robert Williams y Roman Yampolsky de la Universidad de Louisville en Kentucky suben al escenario. Estos tipos
intentaron poner en marcha tal cosa , pero descubrieron que no todo era tan simple. Los sistemas de aprendizaje automático existentes no son capaces de ofrecer sus propias ilusiones ópticas, al menos todavía no. Por qué
Primero, información general. Los avances recientes en el aprendizaje profundo se basan en dos avances. El primero es la disponibilidad de poderosas redes neuronales y un par de trucos de software que les permiten aprender bien.
El segundo es la creación de grandes bases de datos marcadas en términos de volumen, sobre la base de qué máquinas pueden aprender. Por ejemplo, para enseñarle a una máquina a reconocer caras, se necesitan decenas de miles de imágenes que contengan caras claramente marcadas. Con esta información, la red neuronal puede aprender a reconocer los patrones característicos de las caras: dos ojos, una nariz y una boca. Aún más impresionante, un par de redes: las llamadas
Red generacional competitiva (GSS): capaz de enseñarse mutuamente a crear imágenes realistas y completamente artificiales de caras.
Williams y Yampolsky concibieron para enseñar a la red neuronal a determinar las ilusiones ópticas. La capacidad de computación es suficiente y no hay suficientes bases de datos adecuadas. Por lo tanto, su primera tarea fue crear una base de datos de ilusiones ópticas para entrenamiento.
Resultó ser difícil de hacer. "Hay solo unos pocos miles de ilusiones ópticas estáticas, y el número de tipos únicos de ilusiones es muy pequeño, tal vez un par de docenas", dicen.
Y este es un serio obstáculo para los sistemas modernos de aprendizaje automático. "Crear un modelo que pueda aprender de un conjunto de datos tan pequeño y limitado será un gran avance para los modelos generativos y la comprensión de la visión humana", dicen.
Por lo tanto, Williams y Yampolsky recopilaron una base de datos de más de 6,000 imágenes de ilusiones ópticas y entrenaron a la red neuronal para reconocerlas. Luego crearon el GSS, que debería crear ilusiones ópticas de forma independiente.
Los resultados los decepcionaron. "Después de siete horas de entrenamiento en el Nvidia Tesla K80, no se creó nada de valor", dijeron los investigadores, que abrieron la base de datos para que todos la utilicen.
El resultado, sin embargo, es interesante. "Las únicas ilusiones ópticas que conocemos fueron creadas por la evolución (por ejemplo, patrones de ojos en alas de mariposa) o artistas humanos", señalan. Y en ambos casos, las personas desempeñaron un papel crucial en la retroalimentación: las personas pueden ver la ilusión.
Y los sistemas de visión artificial no pueden. "Es improbable que el GSS aprenda a engañar a la visión sin comprender los principios que subyacen a las ilusiones", dicen Williams y Yampolsky.
Esto puede ser un desafío, ya que existen diferencias críticas entre los sistemas visuales del hombre y la máquina. Muchos investigadores crean redes neuronales que recuerdan aún más el sistema visual humano. Quizás una de las comprobaciones interesantes para estos sistemas será si pueden ver la ilusión.
Mientras tanto, Williams y Yampolsky no son optimistas: "Aparentemente, un conjunto de datos con ilusiones puede no ser suficiente para crear nuevas ilusiones", dicen. Entonces, por ahora, las ilusiones ópticas siguen siendo un bastión de la percepción humana, no están sujetas a máquinas.