Google a montré un réseau de neurones qui pouvait reconnaître un pays à partir d'une photo (ainsi qu'une ville et une rue), même si la photo avait été prise dans une maison

Il est facile de savoir où la photo est prise si la Tour Eiffel, le Taj Mahal, la basilique Saint-Pierre, le Lincoln Memorial ou la Place Rouge sont en arrière-plan. Les développeurs de Google sont allés plus loin et ont créé un réseau de neurones qui pourrait reconnaître un endroit à partir d'une photo, même si elle a été prise à l'intérieur.

image

Les gens peuvent non seulement utiliser les vues pour comprendre où la photo est prise. L'endroit peut être déterminé par le plat dans le restaurant, dans le sens de la circulation, par la vache dans la rue, l'architecture des bâtiments et la combinaison de tous ces facteurs. Et de quoi la voiture est-elle capable? Les développeurs de la

technologie PlaNet ont divisé la plupart des terres en 26 000 zones de différentes tailles, selon le nombre de photographies prises dans une zone particulière. Les grandes villes ont plus de «cellules», car davantage de photos y ont été prises, tandis qu'à la campagne, les «cellules» sont plus grandes. Les mers, les océans et les zones polaires sont passés.

image

Une base de données de 126 millions de photos provenant d'Internet a été utilisée avec leurs données EXIF. 91 millions de photographies ont été utilisées pour former le réseau neuronal, et les 34 millions restants ont été utilisés pour évaluer son travail.

Pour tester l'efficacité du réseau neuronal, 2,3 millions d'images géo-ciblées de Flickr ont été utilisées. 3,6% des images PlaNet reconnues avec précision à la rue, 10% - avec précision à la ville. Le pays a identifié le réseau neuronal dans 28,4% des cas, et le continent - dans 48%.

Ce résultat a été comparé aux capacités d'une dizaine de voyageurs utilisant le jeu GeoGuessr.com , dans lequel vous devinez l'endroit sur Google Street View. PlaNet a battu des personnes avec une erreur moyenne de 1 131,7 kilomètres. Les gens se sont trompés à une moyenne de 2 320,75 kilomètres.

Selon l'un des principaux chercheurs, Tobias Weyand, l'avantage de la machine est que le réseau neuronal «a vu» beaucoup plus que toute personne vivante qui a voyagé à travers le monde toute sa vie.

Les développeurs sont allés plus loin et ont commencé à travailler avec des photographies prises sur place. Vous pouvez les reconnaître dans les cas où la photo fait partie d'un album - la machine parcourt complètement les albums et recherche les images les plus spécifiques faites au même endroit

Le réseau de neurones lui-même ne prend que 377 mégaoctets.

Source: https://habr.com/ru/post/fr390903/


All Articles