Top 5 Anwendungsbereiche für Objekterkennungssysteme



Der Versuch, verschiedenen Systemen beizubringen, die Welt so zu sehen und zu verstehen, wie es ein Mensch tut, begann vor einigen Jahrzehnten, aber jetzt sind diese Technologien so perfekt geworden, dass sie in vielen Bereichen unseres Lebens aktiv eingesetzt werden. Habré hat bereits ausführliche Artikel zu Bildverarbeitung, neuronalen Netzen und Erkennungsalgorithmen veröffentlicht. Wir werden diese komplexen Technologien nicht näher erläutern, sondern über den praktischen Einsatz dieser Systeme in der realen Welt sprechen.

Wie funktioniert es Kurz


Was für uns Fotografie für ein Bilderkennungssystem ist, ist nur ein Satz von Pixeln mit unterschiedlichen Farbparametern. Um dem System das Erkennen einzelner Objekte in einem Bild beizubringen, müssen Sie ihm einen Datensatz zur Verfügung stellen - eine Reihe von Tausenden von Bildern, die genau angeben, wo sich das gewünschte Objekt befindet. Wenn das System beispielsweise lernen soll, Menschen in Bildern zu erkennen, müssen wir ihm viele Fotos von Menschen unterschiedlichen Alters, in verschiedenen Posen und Kleidern unter verschiedenen Bedingungen zeigen. Nach einer solchen Schulung kann das System die Person auf den Fotos genau erkennen. Es stellt sich jedoch eine andere Frage: Wenn ein Foto für ein System nur eine Sammlung von Pixeln ist, wie versteht dann ein neuronales Netzwerk, was genau auf einem Foto dargestellt ist?

Verschiedene Methoden werden verwendet, um Objekte im Bild zu erkennen. Eine der vielversprechendsten Methoden ist jedoch die Methode des orientierten Gradientenhistogramms (HOG). Das Bild wird verfärbt, und dann findet das System in Blöcken von 16 x 16 Pixel die Richtung der Farbänderung (Gradientenvektor), erstellt eine Karte dieser Vektoren über das gesamte Bild und "schnappt" dabei die Zeichen des Objekts, die sich je nach Position / Position und Beleuchtung nicht ändern. Eine verbesserte Version des Algorithmus heißt CoHOG - er berücksichtigt die Grenzen von Objekten, dh er erkennt die Form und nicht nur die Gradientenvektoren.

Toshiba hat die CoHOG-Methode verbessert und die Erkennung bei schlechten Lichtverhältnissen erheblich verbessert. Das herkömmliche CoHOG beispielsweise ist bei schneller Erkennung im Dunkeln schlecht, wenn Fußgänger im Scheinwerferlicht fast nicht sichtbar sind. Die ECoHOG-Methode (Technologie von Histogrammen des kombinierten Vorhandenseins orientierter Gradienten) bestimmt eine Person durch zusätzliche Analyse der Richtungen und Größen ihrer Umrisse, wobei Kopf, Beine, Arme, Schultern gefunden werden. Wenn CoHOG einfach anthropometrische Umrisse auf dem Bild isoliert (Analyse „Objektgrenze - Grenzvektoren“), sind für ECoHOG die Dimensionen der Objektgrenzen relativ zueinander wichtig.

Fünf Hauptanwendungsbereiche


Marketing


Die Mustererkennung ist ein vielversprechender Bereich in Werbung und Marketing. Neuronale Netze können in wenigen Stunden Dinge lernen, für deren Suche in anderen Fällen ein großes Team von Fachleuten und Wochen oder sogar Monate der Forschung erforderlich sind. Beispielsweise verfolgt der russische Dienst YouScan, ein Überwachungssystem für soziale Medien, die Erwähnung von Marken in sozialen Netzwerken. Darüber hinaus tut er dies nicht nur im Text der Beiträge, sondern auch auf Fotografien und hilft auch, bestimmte Schlussfolgerungen über das Produkt zu ziehen. Mit Hilfe der Mustererkennung wurde auf dem Foto ein interessantes Muster gefunden, nach dem niemand gesucht hätte: Bei Tieren werden Katzen häufiger mit Apple-Technologie und Hunde mit der Marke Adidas gefunden. Diese ungewöhnlichen Informationen können für die Ausrichtung von Werbung hilfreich sein.


Bei der Suche nach dem Adidas-Logo hat der YouScan-Dienst Fotos mit Smartphones in den Händen der Eigentümer gefiltert. Copyright: YouScan

Videoüberwachung


Die Mustererkennung bei städtischen Überwachungskameras ist möglicherweise die unvermeidlichste Aussicht auf die Verwendung von Bildverarbeitung. Seit 2017 wird in Moskau ein intelligentes Videoüberwachungssystem getestet, um Kriminelle an überfüllten Orten zu identifizieren. Die Technologie des russischen Unternehmens NTechLab, das bereits dazu beigetragen hat, mehrere Dutzend Straftäter festzunehmen, ist an das städtische Kameranetz angeschlossen. In China kann ein solches Videoüberwachungssystem nicht nur Gesichter, sondern auch Marken von Autos und Kleidung in der Öffentlichkeit erkennen, die anschließend von Vermarktern für ihre Forschung verwendet werden können.

Das Video zeigt die eigentliche Arbeit der Erkennung von Bildern und Gesichtern SenseTime

Medizin


Die Mustererkennung ist in der Medizin bereits zu einem echten Durchbruch geworden - in vielen Fällen bemerken Computer Dinge, die selbst die erfahrensten Ärzte vermissen. Sie fungieren als eigenartige Assistenten, deren „technische“ Meinung die Hypothese des Arztes bestätigt oder zu tieferen Forschungen führt.

In Russland ist die Entwicklung von Softwaresystemen zur Diagnose von Krebserkrankungen auf CT-, MRT- und PET-Bildern im Gange. Zu diesem Zweck werden Tausende von markierten Bildern durch das neuronale Netzwerk geleitet, wonach die Erkennungsgenauigkeit neuer Bilder auf 95 bis 97% steigt. Die Entwicklung einer solchen Plattform wird unter anderem vom Moskauer Ministerium für Informationstechnologie unter Verwendung der offenen Bibliothek Google TensorFlow durchgeführt.

Ein von Google erstelltes neuronales Inception-Netzwerk analysiert eine mikroskopische Untersuchung einer Lymphknotenbiopsie, um nach Krebszellen in den Brustdrüsen zu suchen. Für eine Person ist dies ein sehr langer und mühsamer Prozess, bei dem es leicht ist, einen Fehler zu machen oder etwas Wichtiges zu übersehen, da in einigen Fällen die Bildgröße 100.000 x 100.000 Pixel beträgt. Das neuronale Inception-Netzwerk bietet eine Empfindlichkeit von etwa 92% gegenüber 72% beim Arzt. Das neuronale Netzwerk verliert nicht alle verdächtigen Bildbereiche aus den Augen, obwohl Fehlalarme zulässig sind, die der Arzt später filtern wird.

Autos


Die Objekterkennung in Autos ist ein notwendiger Bestandteil der ADAS-Sicherheitssysteme (Advanced Driver Assistance Systems). ADAS kann mit hoch entwickelten Werkzeugen wie Radar- und Infrarotsensoren oder mit einer Monokular-Kamera implementiert werden. In einem früheren Artikel haben wir bereits gesagt, dass eine Videokamera ausreicht, damit ein Auto Fußgänger, Schilder und Ampeln in Echtzeit erkennt. Eine solche Erkennung "on the fly" ist jedoch eine sehr ressourcenintensive Aufgabe, die einen spezialisierten Prozessor erfordert. Toshiba entwickelt seit mehreren Jahren eine Reihe von Prozessoren. Sie bauen ein dreidimensionales Modell auf, das auf einem bewegten Bild einer einzelnen Kamera basiert, und bemerken dabei unbekannte Hindernisse auf der Straße. Wenn ein neuronales Netzwerk darauf trainiert ist, nur Personen, Markierungen und Zeichen zu erkennen, wird ein auf Asphalt liegender Reifen oder ein Stück Zaun nicht erkannt und als Gefahr angesehen.


Visconti-Prozessoren identifizieren Zonen im Bild, klassifizieren sie und helfen dem Autopiloten oder ADAS, eine Entscheidung zu treffen. Quelle: Toshiba

Drohnen


In Drohnen wird die Objekterkennung sowohl zu Unterhaltungs- als auch zu wissenschaftlichen Zwecken verwendet. Im Jahr 2015 machte die Lily-Drohne mit automatischem Motorstart beim Werfen und Verfolgen der Funktion für den Besitzer viel Lärm. Lily richtete das Objektiv auf den Besitzer, unabhängig von der Flugbahn und Geschwindigkeit seiner Bewegung. Diese Funktion von Lily hatte zwar nichts mit Mustererkennung zu tun, da die Drohne nicht nur das Bild einer Person beobachtete, sondern auch das Bedienfeld, das auf die Hand des Besitzers gelegt wurde.


Bilderkennungsdrohnen werden auch für ernstere Dinge verwendet. Beispielsweise hat das norwegische Unternehmen eSmart Systems Smart-Grid-Lösungen entwickelt. In einem ihrer Projekte, Connected Drone, werden Drohnen zur Fehlerbehebung bei Stromleitungen eingesetzt. Sie sind in der Erkennung von Stromnetzelementen geschult und überprüfen die Unversehrtheit von Drähten, Isolatoren und anderen Teilen von Stromleitungen. Dies ist besonders wichtig, um eine Fehlfunktion schnell zu lokalisieren, wenn die Stromversorgung einer Stadt oder eines Unternehmens von der Leitung abhängt. Angesichts der Tatsache, dass Stromleitungen häufig an schwer erreichbaren Orten gebaut werden, ist es viel effektiver, eine Drohnencrew zu schicken, um irgendwo in der Taiga oder in den Bergen eine Fehlfunktion zu finden, als ein Team von Menschen zu schicken.


ESmart-Drohnen finden Elemente der Energieinfrastruktur und markieren im Schadensfall das Objekt, sodass der Bediener gewarnt wird. Quelle: eSmart Systems

Source: https://habr.com/ru/post/de433544/


All Articles