Si usa Internet, debe haber interactuado con redes neuronales. Esta es una forma de algoritmo de aprendizaje automático utilizado en muchos campos, desde la traducción de idiomas hasta el modelado financiero. Una de las especialidades de este enfoque es el reconocimiento de imágenes. Varias compañías, incluidas Google, Microsoft, IBM y Facebook, han desarrollado sus propios algoritmos de diseño de fotos. Pero aunque estos algoritmos pueden cometer errores muy extraños.
La API de Microsoft Azure para visión por computadora agregó el siguiente título a esta imagen: "un rebaño de ovejas pasta en una ladera cubierta de exuberante vegetación", y las etiquetas: "pastan, ovejas, montañas, vacas, caballos". Pero no hay ovejas en la foto. En general Estudié cada lugar.
etiquetas: pasto, campo, ovejas, de pie, arcoiris, hombreEn esta foto, la computadora también vio las ovejas. Por casualidad, sé que algunas ovejas realmente pastaban cerca de este lugar. Pero no son visibles en la foto.
Etiquetas: ladera, pastar, ovejas, jirafas, rebañoAquí hay otro ejemplo. Las redes neuronales generalmente imaginaban ovejas cada vez que veía esas imágenes. Que esta pasando
Las redes neuronales se entrenan procesando muchos ejemplos. En este caso, fue alimentada con muchas imágenes marcadas por personas manualmente, y había ovejas en muchas de ellas. Comenzando con una falta total de conocimiento sobre lo que ha visto, las redes neuronales necesitan crear reglas según las cuales las imágenes deben etiquetarse como "ovejas". Aparentemente, ella no entendió que la palabra "oveja" significa un animal, y no solo hierba sin árboles. De manera similar a la segunda foto, le dio a la etiqueta "arco iris", porque ese paisaje es húmedo y lluvioso, sin darse cuenta de que un arco iris necesita una franja multicolor.
¿Quizás las redes neuronales son demasiado sensibles y ven ovejas por todas partes? Resulta que no. Ven ovejas solo cuando esperan verlas. Encuentran ovejas fácilmente en los campos y en las laderas de las montañas, pero tan pronto como las ovejas comienzan a aparecer en lugares inesperados, se hace evidente cuánto dependen estos algoritmos de adivinanzas y probabilidades.
Lleva a la oveja a la habitación y será designada como un gato. Levante una oveja o una cabra en sus brazos y lo marcarán como un perro.
“Izquierda: un hombre sostiene un perro en la mano. Derecha: una mujer sostiene un perro en la mano.Píntalas de naranja y se convertirán en flores.
"Algunas flores naranjas en el campo"Pon a las ovejas con una correa y lo designarán como un perro. Ponla en el auto y será un perro o un gato. Si entran en el agua, se pueden observar como pájaros o incluso osos polares.
Y si las cabras trepan a un árbol, se convertirán en pájaros. O jirafas (resultó que Microsoft Azure es conocido por ver jirafas en todas partes debido a la abundancia excesiva de jirafas que se rumoreaba que estaban en el conjunto de datos inicial).
NeuralTalk2: una bandada de pájaros vuela en el aire
Microsoft Azure: varias jirafas se paran junto a un árbolLas redes neuronales correlacionan patrones. Ven pedazos de textura similares al pelaje, parches verdes y deciden que hay ovejas en la imagen. Si ven pieles y formas que se asemejan a una cocina, pueden decidir que ven gatos.
Si la vida sigue las reglas, el reconocimiento de imágenes funciona como debería. Pero tan pronto como las personas o las ovejas hacen algo inesperado, los algoritmos muestran inmediatamente debilidad.
Si quieres que algo pase desapercibido más allá de la red neuronal, el surrealismo te ayudará en un estilo casi ciberpunk. Quizás en el futuro, los agentes secretos se disfrazarán de gallinas o conducirán automóviles manchados como vacas.
Hay muchos ejemplos de errores muy divertidos en el hilo de Twitter que comenzaron con una simple pregunta:
Y usted mismo puede probar el funcionamiento de la API para el reconocimiento de patrones de Microsoft Azure y asegurarse de que incluso los algoritmos más avanzados confíen en la suerte y la probabilidad. Otro algoritmo, NeuralTalk2, solía procesar imágenes de este hilo de comentarios en Twitter.