Google zeigte ein neuronales Netzwerk, das ein Land anhand eines Fotos (sowie einer Stadt und einer Straße) erkennen konnte, selbst wenn das Foto in einem Haus aufgenommen wurde
Es ist leicht herauszufinden, wo das Foto aufgenommen wurde, wenn sich im Hintergrund der Eiffelturm, das Taj Mahal, der Petersdom, das Lincoln Memorial oder der Rote Platz befinden. Entwickler von Google gingen noch einen Schritt weiter und erstellten ein neuronales Netzwerk, das einen Ort anhand eines Fotos erkennen konnte, selbst wenn es in Innenräumen aufgenommen wurde.
Menschen können nicht nur die Sehenswürdigkeiten nutzen, um zu verstehen, wo das Foto aufgenommen wurde. Der Ort kann durch das Gericht im Restaurant, in Verkehrsrichtung, durch die Kuh auf der Straße, die Architektur der Gebäude und die Kombination all dieser Faktoren bestimmt werden. Und wozu ist das Auto fähig? Die Entwickler der PlaNet-Technologie haben den größten Teil des Landes in 26.000 Zonen unterschiedlicher Größe unterteilt, abhängig von der Anzahl der in einem bestimmten Gebiet aufgenommenen Fotos. Großstädte erhielten mehr „Zellen“, weil mehr Fotos in ihnen aufgenommen wurden, während auf dem Land „Zellen“ größer waren. Meere, Ozeane und Polarzonen sind vorbei.
Eine Datenbank mit 126 Millionen Fotos aus dem Internet wurde zusammen mit ihren EXIF-Daten verwendet. 91 Millionen Fotos wurden verwendet, um das neuronale Netzwerk zu trainieren, und die restlichen 34 Millionen wurden verwendet, um seine Arbeit zu bewerten.Um die Wirksamkeit des neuronalen Netzwerks zu testen, wurden 2,3 Millionen geografische Bilder von Flickr verwendet. 3,6% der Bilder, die PlaNet mit Genauigkeit für die Straße erkannt hat, 10% - mit Genauigkeit für die Stadt. Das Land identifizierte das neuronale Netz in 28,4% der Fälle und den Kontinent - in 48%.Dieses Ergebnis wurde mit den Fähigkeiten eines Dutzend Reisender verglichen, die das Spiel GeoGuessr.com verwendeten , in dem Sie den Ort in Google Street View erraten. PlaNet schlug Menschen mit einem durchschnittlichen Fehler von 1.131,7 Kilometern. Die Menschen haben sich bei durchschnittlich 2.320,75 Kilometern geirrt.Laut einem der Hauptforscher, Tobias Weyand, besteht der Vorteil der Maschine darin, dass das neuronale Netzwerk viel mehr „gesehen“ hat als jeder lebende Mensch, der sein ganzes Leben lang um die Welt gereist ist.Die Entwickler gingen weiter und begannen mit Fotos zu arbeiten, die auf dem Gelände aufgenommen wurden. Sie können sie in Fällen erkennen, in denen das Foto Teil eines Albums ist - das Gerät durchsucht die Alben vollständig und sucht nach den spezifischsten Bildern, die an derselben Stelle erstellt wurden.Das neuronale Netzwerk selbst nimmt nur 377 Megabyte ein. Source: https://habr.com/ru/post/de390903/
All Articles