Google-Autos erkennen Fußgänger mit hoher Genauigkeit
Bis zum Aufkommen unbemannter Fahrzeuge bleibt nicht viel Zeit. Google erinnert an die Technologie der Bildverarbeitung und eines der wichtigsten Elemente - die Erkennung von Fußgängern in Echtzeit.Die Google-Forscher Alex Krizhevsky, Anelia Angelova und Kollegen stellten eine neue Methode zur Erkennung von Fußgängern mithilfe neuronaler Netze vor . Die Methode zeigte ein ermutigendes Ergebnis: Ein Fußgänger kann in 73,8% der Fälle mit hoher Genauigkeit durch den Caltech-Fußgängertest erkannt werden, der eine Datenbank mit 50.000 markierten Fußgängern unter städtischen und ländlichen Bedingungen enthält. Dieses Ergebnis ist vergleichbar mit den besten alternativen Designs.Experten sagen, dass einer der vielversprechenden Bereiche in den letzten Jahren die Verwendung von GPU-Beschleunigern in neuronalen Netzen war , um fast in Echtzeit komplexe Algorithmen zur Mustererkennung, NLP und fließenden Analyse des Videostreams auszuführen.Auf der jüngsten Nvidia GPU-Technologiekonferenz wurden mehrere solcher Lösungen vorgestellt . Der technologische Fortschritt in diesem Bereich zeigt sich am besten im ImageNet Large Scale Visual Recognition Challenge- Test , der seit 2010 durchgeführt wird. Seitdem hat das Ausmaß der Fehler bei der Klassifizierung von Bildern durch Bildverarbeitungsalgorithmen dramatisch abgenommen.
Die Fußgängererkennung ist eine der praktischen Aufgaben, bei denen neue Technologien eingesetzt werden. In Zukunft werden neuronale Netze mit GPU-Beschleunigung wahrscheinlich in Überwachungskameras, Fahrzeugverkehrskontrollsystemen usw. Anwendung finden.Zurück zur Entwicklung von Google: Die Erkennung von Fußgängern ist eine sehr schwierige Aufgabe, da sie unter sich ständig ändernden Umgebungsbedingungen in nahezu Echtzeit gelöst werden muss. Objekte rund um das Auto sind in Bewegung. Bestehende Technologien lösen dieses Problem relativ erfolgreich. Beispielsweise zeigt eine der Methoden im Caltech-Fußgängertest eine Genauigkeit von 58%. Eine andere Methode namens VeryFast bietet Videoaufnahmen mit 100 Bildern / s (zum Vergleich: Google schießt mit 15 Bildern / s), aber dort ist die Genauigkeit geringer. Es gibt Methoden mit höherer Genauigkeit, die jedoch viel langsamer arbeiten und die Geschwindigkeit auf das 195-fache reduzieren.Google Research hat sich zum Ziel gesetzt, die Erkennungsgenauigkeit zu verbessern, ohne die Geschwindigkeit zu beeinträchtigen. Bei 15 Bildern / s zeigten sie eine dramatische Erhöhung der Genauigkeit auf 73,8% .Der Satz „26,2% durchschnittliche Fehlerquote“ aus einem wissenschaftlichen Artikel sollte nicht irreführend sein: Wir sprechen nicht über die Tatsache, dass das Auto einen Fußgänger verfehlt hat und keine Punkte wie in Carmageddon verdient hat. Im Gegenteil, der Ausdruck bedeutet, dass dieser Algorithmus die Person, die vor ihm bremsen soll, „verfehlt“ und nicht erkannt hat.Bei Google Research wurde das Bildverarbeitungssystem mit dem GPU-Grafikbeschleuniger Nvidia K20 Tesla der alten Generation eingeführt. Jetzt werden neue Versionen von K40 und K80 veröffentlicht, die in einigen Supercomputern der Top500-Klasse verwendet werden.Das Google Research-Team beabsichtigt, das Ergebnis zu verbessern, indem es die Tiefe der Kaskade neuronaler Netze erhöht und das Verhältnis von Leistung und Genauigkeit optimiert.Auf die eine oder andere Weise, aber mit dem Aufkommen von Roboterautos auf den Straßen ist es besser, sich heller zu kleiden als sich zu tarnen, damit die Bildverarbeitung des Autos Sie nicht mit dem Hintergrund verwechselt. Auf der anderen Seite kann ein solcher Rat auch jetzt noch gegeben werden, wenn Autos oft von halb blinden, halb betrunkenen und abgelenkten Fahrern gefahren werden.Source: https://habr.com/ru/post/de382879/
All Articles