Google mostró una red neuronal que podía reconocer un país a partir de una fotografía (así como una ciudad y una calle), incluso si la fotografía fue tomada en una casa

Es fácil averiguar dónde se tomó la foto si la Torre Eiffel, el Taj Mahal, la Basílica de San Pedro, el Monumento a Lincoln o la Plaza Roja están en el fondo. Los desarrolladores de Google fueron más allá e hicieron una red neuronal que podía reconocer un lugar a partir de una fotografía, incluso si se tomaba en interiores.

imagen

Las personas pueden usar no solo las vistas para comprender dónde se toma la foto. El lugar puede ser determinado por el plato en el restaurante, en la dirección del tráfico, por la vaca en la calle, la arquitectura de los edificios y la combinación de todos estos factores. ¿Y de qué es capaz el coche? Los desarrolladores de

tecnología PlaNet han dividido la mayor parte de la tierra en 26,000 zonas de varios tamaños, dependiendo de la cantidad de fotografías tomadas en un área en particular. Las grandes ciudades obtuvieron más "celdas", porque se tomaron más fotos en ellas, mientras que en el campo las "celdas" eran más grandes. Mares, océanos, zonas polares han pasado.

imagen

Se utilizó una base de datos de 126 millones de fotos de Internet junto con sus datos EXIF. Se usaron 91 millones de fotografías para entrenar la red neuronal, y los 34 millones restantes se usaron para evaluar su trabajo.

Para verificar la efectividad de la red neuronal, se utilizaron 2,3 millones de imágenes geo-dirigidas de Flickr. 3.6% de las imágenes PlaNet reconocidas con precisión a la calle, 10% - con precisión a la ciudad. El país identificó la red neuronal en el 28,4% de los casos, y el continente, en el 48%.

Este resultado se comparó con las capacidades de una docena de viajeros que usan el juego GeoGuessr.com , en el que adivinan el lugar en Google Street View. PlaNet venció a las personas con un error promedio de 1,131.7 kilómetros. La gente se equivocó en un promedio de 2,320.75 kilómetros.

Según uno de los principales investigadores, Tobias Weyand, la ventaja de la máquina es que la red neuronal "vio" mucho más que cualquier persona viva que haya viajado por el mundo toda su vida.

Los desarrolladores fueron más allá y comenzaron a trabajar con fotografías tomadas en las instalaciones. Puede reconocerlos en los casos en que la foto sea parte de un álbum: la máquina escanea los álbumes por completo y busca las imágenes más específicas realizadas en el mismo lugar.

La red neuronal ocupa solo 377 megabytes.

Source: https://habr.com/ru/post/es390903/


All Articles