Video Analytics Harvester: Was Gehirn und Maschinen mit unseren Gesichtern machen

Bild

Die Fähigkeit, Gesichter zu sehen und schnell zu erkennen, ist Supermacht. Sie müssen keine Zeit damit verbringen, Falten, Falten und Ovale zu analysieren und zu untersuchen. Die Gesichtserkennung ist sofort und mühelos. Es ist so einfach, dass wir nicht erkennen, wie wir es machen.

Überlegen Sie, wie unterschiedliche Gesichter aussehen - zwei Augen, ein Mund, eine Nase, Ohren, die an den Seiten hervorstehen, jedes Mal in derselben Reihenfolge (meistens). Es ist unglaublich, dass wir ein Objekt so einfach analysieren.

Wir sind „programmiert“, um Gesichter von Geburt an zu erkennen, aber jetzt haben die Menschen mehr erreicht - sie haben der Maschine diese Fähigkeit beigebracht. Wie wird sich die weit verbreitete Implementierung von Systemen zur Erkennung und Identifizierung von Personen auf die Gesellschaft auswirken?

Pareidolia: automatische Gesichtssuche


Bild

Personen im "automatischen" Modus können auf jeder Oberfläche zwischen bekannten Bildern unterscheiden. Nur drei architektonische Elemente des Gebäudes werden als Gesicht einer überraschten Ente wahrgenommen. Dies ist ein Beispiel für Pareidolie.

Das Wort Pareidolie kommt von den griechischen Wörtern para (para - nah, nah, Abweichung von irgendetwas) und eidolon - Bild. Dies ist der Name einer optischen Täuschung, die Wahrnehmung eines Bildes oder eine Bedeutung, wo sie wirklich nicht sind. Zum Beispiel ist ein Gesicht auf einem Baumstamm oder Tierfiguren in den Wolken eine Pareidolie.

Bild
Weitere solche Fotos finden Sie auf thingswithfaces.com

Die Gesichter von Menschen und die Gesichter von Tieren sehen wir in jeder geometrischen Figur. Die gesamte Emoji-Kultur baut auf diesem Prinzip auf. :-)

Bild

Das Phänomen der Pareidolie lässt sich leicht in die Sprache der Algorithmen übersetzen. Die Shinseungback-Künstler Kimyonghun fotografierten Wolken und verschmolzen für einen Moment mit einem Skript mit der OpenCV-Bibliothek zu menschlichen Gesichtern.

Thatchers Illusion: Systembiologische Fehler


Bild

Es gibt einen biologischen Fehler, der die große Bedeutung der Erkennungsfähigkeit zeigt . Die meisten Objekte um Sie herum - ein Stuhl, ein Tisch, ein Computer - sind aus jedem Blickwinkel leicht zu sehen und korrekt zu identifizieren. Nur keine Gesichter.

Das umgekehrte Gesicht führt zu einer Fehlfunktion im Gehirn, die als Thatcher-Effekt (Illusion) bezeichnet wird. Das Phänomen beschreibt einen Zustand, in dem es schwierig ist, lokale Änderungen in einem invertierten Porträtfoto zu erkennen.

Drehen Sie das Foto von Margaret Thatcher um und sehen Sie sich das Ergebnis an.
Bild

Das erste Foto scheint normal zu sein, aber wenn Sie es umdrehen, fällt sofort die falsche Position von Augen und Mund auf. Der Mensch und ein künstliches neuronales Netzwerk nehmen Bilder auf unterschiedliche Weise wahr. Es ist erstaunlich, dass das „neuronale Netzwerk“ zwischen unseren Ohren so leicht zu täuschen ist.

Thatchers Illusion zeigt einige grundlegende Mechanismen, mit denen unser Gehirn Informationen verarbeitet. Das Gehirn liest eine Reihe einzelner Elemente: ein Paar Augen, Nase, Mund, Ohren. Neben den individuellen Merkmalen der Gesichtszüge wird auch deren Beziehung zwischen sich und dem Standort berücksichtigt. Das heißt, eine Person wird als ganzes System wahrgenommen.

Wenn uns ein umgekehrtes Gesicht gezeigt wird, ist es für das Gehirn daher schwieriger, das gesamte Bild zu bewerten - die Informationen werden für jedes Element separat "gesammelt": Die Augen sind an Ort und Stelle, der Mund ist wie ein Mund. Sobald uns jedoch das rechte Gesicht gezeigt wird, stellt sich plötzlich die Wahrnehmung eines einzelnen Systems wieder her und es treten Probleme auf: Es wird deutlich, dass die bekannten Funktionen auf ungewöhnliche Weise miteinander verbunden sind.

Warum ist das wichtig? Das menschliche Gehirn kann aufgrund der Integrität der Wahrnehmung die kleinsten Unterschiede in den Gesichtszügen erkennen. Der Bereich der Großhirnrinde erkennt das Gesicht und bestimmt die Blickrichtung, die Amygdala und der Insellappen analysieren den Gesichtsausdruck, und der Bereich im präfrontalen Bereich des Frontallappens und das für das Gefühl des Vergnügens verantwortliche Gehirnsystem bewerten seine Schönheit.

Ein Fehler wie ein Feature: Tschernows Gesichter


Bild
( c )

Die Besonderheit der menschlichen Wahrnehmung wird verwendet, um aggregierte mehrdimensionale Daten unter Verwendung von "Gesichtern" zu analysieren. Der amerikanische Mathematiker German Chernov skizzierte 1973 das Konzept der Verwendung von „Personen“, um charakteristische Beziehungen zu identifizieren und komplexe Beziehungen zwischen mehreren Variablen zu untersuchen.

Die Chernov-Daten werden in Form von Gesichtspiktogrammen wiedergegeben, in denen die relativen Werte der ausgewählten Variablen als Formen und Größen der einzelnen Merkmale dargestellt werden: Nasenlänge, Winkel zwischen den Augenbrauen, Gesichtsbreite - insgesamt bis zu 36 Variablen. Somit kann der Beobachter visuelle Eigenschaften von Objekten identifizieren, die für jede Wertekonfiguration eindeutig sind.

Durch einen kurzen Blick auf das aus Flächen bestehende Diagramm können Sie schnell feststellen, ob sich die Eigenschaften der Profile erheblich unterscheiden (übereinstimmen). Bei einer detaillierten Überprüfung der Gesichtsmerkmale wird deutlich, in welchen Merkmalen (jedes Gesichtsmerkmal ist ein separates Merkmal des Originaldatensatzes) die Ähnlichkeit besteht und was der Unterschied ist. In der obigen Abbildung ist beispielsweise der Unterschied zwischen Ländern durch traurige und lustige Emoticons leicht zu erkennen.

Warum dein Gesicht pflegen?


Bild

Die Fähigkeit der schnellen Gesichtserkennung hilft, Ihr Kind vom Kindergarten abzuholen, einen Partner auszuwählen, Emotionen richtig und angemessen auszudrücken. Aber was passiert, wenn eine Person diese Fähigkeit auf ein künstliches neuronales Netzwerk überträgt?

Eine Idee kann zur Ablehnung führen. Nicht jeder ist bereit, Technologien zu akzeptieren, die Daten speichern, Bewegungen überwachen, Einkäufe und Emotionen analysieren. Der Übergang von der einfachen Videoüberwachung zur personalisierten Videoanalyse bringt eine erhebliche Zunahme der Verantwortung mit sich.

Bild

Heutzutage bestimmen Algorithmen wie DeepFace die Ähnlichkeiten von Individuen mit einer Genauigkeit, die höher ist als die von Menschen. Der Nvidia-Algorithmus selbst erstellt in wenigen Sekunden die Gesichter nicht existierender Personen. Die Gesichter in der obigen Collage werden vom neuronalen StyleGAN-Netzwerk generiert , das auf einem Datensatz von 70.000 Bildern trainiert wird. Sie sehen erschreckend realistisch aus.

Bild
Demonstration des SearchFace-Algorithmus

Zuerst verursachte der Facebook-Gesichtserkennungsalgorithmus eine erhöhte Aufmerksamkeit, aber dann gewöhnten sich alle daran (oder verließen das soziale Netzwerk). Der FindFace-Dienst für die Suche nach Personen auf Fotos in VKontakte erhielt gemischte Bewertungen und wurde für Mobbing verwendet. Die Schließung des ähnlichen SearchFace-Projekts löste jedoch bereits eine negative Reaktion der Benutzer aus. Wenn die Daten verfügbar sind, lassen Sie sie letztendlich für alle zugänglich sein.

Einzelhändler installieren Gesichtserkennungstechnologien, um Diebstahl zu verhindern und Daten zu Alter, Geschlecht und sogar Emotionen der Kunden zu sammeln. Am Ende ist das Ziel, den Kundenservice zu verbessern und daraus Kapital zu schlagen. Wenn Kunden erkennen, dass das System für sie persönlich von Vorteil ist, werden viele der Einführung neuer Technologien zustimmen.

Angesichts der wachsenden Zahl von Fällen von „Identitätsdiebstahl“ - Betrug mit Kreditkarten und persönlichen Daten - werden Verbraucher das System zum richtigen Zeitpunkt bevorzugen. identifiziert sie richtig.

Derzeit helfen Algorithmen bei der Lösung der Probleme schlechter Rahmenbeleuchtung, niedriger Auflösung und Maskierung - wie Brillen, Perücken und mehrtägige Borsten. Die Systeme laufen mit enormer Geschwindigkeit und ordnen eine Person in nur einer Sekunde einer Datenbank von Millionen von Menschen zu.

Einige Geschäfte in den USA bieten Diebstahlverdächtigen die Wahl: Erlauben Sie sich, ein Foto zu machen oder eine formelle Anklage wegen Straftaten zu erheben. Ein Dieb gewinnt Freiheit zusammen mit einem Einkaufsverbot, und sein Foto wird offiziell in die Datenbank aufgenommen. Dateien mit Bildern von Personen werden verschlüsselt und stehen nur dem Eigentümer des Systems zur Verfügung.

Wer profitiert von der Anerkennung?



Die meisten Geschäfte haben bereits CCTV-Kameras installiert. Für die Videoanalyse ist kein Hardware-Update erforderlich. Verbinden Sie einfach den Cloud-Dienst. Und mit dem Ivideon-Videoanalysedienst fehlt die Eintrittsschwelle praktisch. Die Kosten für die Lösung belaufen sich auf 1.700 Rubel pro Kamera, wodurch jeder Unternehmer Zugang zu Software erhält.

Das Hauptmotiv für Einzelhändler, Gesichtserkennungstechnologien einzusetzen, ist die Verhinderung von Diebstahl. Laut der National Retail Foundation, allein in den USA, gingen 2017 etwa 1,33% aller Waren durch Diebstahl verloren - nicht weniger Schaden im Wert von 46,8 Milliarden US-Dollar.

Die Gesichtserkennungstechnologie reduziert die Anzahl der Ladendiebstähle um mehr als 30%.

Oft beeinflussen sekundäre Faktoren die Höhe des Schadens: Nachlässigkeit der Mitarbeiter, schlechte Vorbereitung des Sicherheitsdienstes, Sparwunsch. Diese und andere Probleme müssen mit Kameras und Cloud-Technologie gelöst werden.

Das Gesichtserkennungssystem erleichtert das schnelle Arbeiten mit schwarzen Listen: Es vergleicht das Foto des Kunden mit einer Datenbank unzuverlässiger Personen und sendet, falls es übereinstimmt, eine entsprechende Warnung an die Wachen.

Analysesoftware erhöht die Sicherheit des Geschäfts erheblich. Ein erfahrener Dieb kann die "blinden Flecken" von Kameras bemerken. In diesem Fall kann der Wachmann den Verdächtigen mit seinem Telefon fotografieren und dann überprüfen, ob sich diese Person in der Datenbank befindet.

Marken nutzen Mobile Marketing schon lange - sie senden SMS, Push-Benachrichtigungen und schalten zielgerichtete Anzeigen. Für den traditionellen Einzelhandel bieten Erkennungssysteme dieselben Funktionen, die Online-Verkäufer mit Cookies erhalten haben.

Dieselbe Plattform, mit der Diebe identifiziert werden, hilft Verkäufern dabei, herauszufinden, welche Ladenfronten Kunden besser anziehen. Das Erkennungssystem hilft dabei, den VIP-Kunden direkt am Eingang des Geschäfts zu identifizieren. Mit den Daten aus CRM kann der Verkäufer einem Kunden schnell ein vorteilhaftes Angebot machen.

Bild
Im Internationalen Finanzzentrum von Seoul bestimmen Kameras auf Informationstafeln in Echtzeit das Alter und das Geschlecht einer Person und bieten Werbung nach festgelegten Parametern an

Kundeninformationen aktivieren ein leistungsstarkes Tool, um den Umsatz zu steigern und die Bedürfnisse des Publikums zu bewerten. Mithilfe der Kameras können Sie die Anzeige von Videoanzeigen für einen bestimmten Besucher je nach Geschlecht, Alter und emotionalem Zustand konfigurieren und Datenanbieter für die Berechnung der Effektivität von Werbung werden.

Die oben genannten Möglichkeiten für Einzelhändler klingen oft nach nervigem Werbebuzz. Die Thesen zu „Gewinnwachstum“ und „Publikumsbedürfnissen“ begleiten jedes IT-Tool auf dem Markt - vom ERP bis zum elektronischen Preisschild. Gibt es etwas mehr für Erkennungssysteme als reines Marketing für künstliche Intelligenz und zukünftige Technologien? Wir werden diese Frage anhand von Beispielen für die Verwendung realer Systeme in vorhandenen Filialen beantworten.

„Arbeit auf dem Feld“: Wer unter realen Bedingungen Gesichter erkennt


Bild

7-Eleven ist die größte Einzelhandelskette der Welt. Seven-Eleven Japan verwaltet mehr als 36.000 kleine Geschäfte in 18 Ländern. Das Unternehmen hat kürzlich Software in 11.000 Filialen installiert . Die Gesichtserkennungs- und Verhaltensanalysetechnologie im Vertriebsnetz wird verwendet, um Inhaber von Kundenkarten zu identifizieren, den Kundenverkehr zu überwachen und den Lagerbestand von Waren in Lagern zu bestimmen.

Bild

Saks ist eine 100 Jahre alte Kette von Premium-Läden, die derzeit im Besitz eines der ältesten Unternehmen der Welt (gegründet 1670) der Hudson's Bay Company ist. Saks verwendet Videoanalysen hauptsächlich, um Diebstahl zu verhindern. Die Software überprüft Fotos von Diebstahlverdächtigen anhand einer Datenbank bekannter Ladendiebe. Die Kameras sind vernetzt, sodass die Ergebnisse in der Saks-Zentrale in New York angezeigt werden können.

Laut Guardian verwenden Premium-Geschäfte und Hotels in Europa regelmäßig Gesichtserkennungstechnologien, um VIPs und Prominente zu verfolgen und ihnen die angenehmsten Bedingungen zu bieten.

Bild

In den USA verwendet das CaliBurger Burger Network die Gesichtserkennungstechnologie in einem Treueprogramm. Der interaktive Kiosk „erkennt“ Kunden, merkt sich Bestellungen und bietet Lieblingsgerichte an, akzeptiert Zahlungen mit Identifikation per Gesicht.

Das System entfernt den Schwellenwert für die Eingabe des Bonusprogramms für ältere Menschen, die möglicherweise Schwierigkeiten haben, die mobile Anwendung, Bonuspunkte und Kreditkarten zu verwenden.

Gesichtserkennungssysteme sind in Asien weit verbreitet, insbesondere in China, wo sie zum Bezahlen von Lebensmitteln, zum Abheben von Bargeld an einem Geldautomaten oder sogar zum Aufnehmen von Krediten verwendet werden. Die Genauigkeit der Gesichtserkennung in China ist dem menschlichen Auge überlegen. Dies ist auch auf den groß angelegten Übergang Chinas von der 2D- zur 3D-Erkennung zurückzuführen.

Im ersten Fall verwenden die Algorithmen zweidimensionale Bilder, die in Datenbanken zur Analyse gespeichert sind. Die 3D-Erkennung analysiert rekonstruierte dreidimensionale Bilder und zeigt eine viel höhere Genauigkeit. In China können Sie mithilfe von Gesichts-Scans Einkäufe tätigen (z. B. Bestellungen bei KFC bezahlen), Zahlungen tätigen und Gebäude betreten.

Bild

In Alipay müssen Sie lächeln, damit das Zahlungserkennungssystem versteht: Bevor es sich nicht um ein Foto handelt, sondern um eine lebende Person. Es wird behauptet, dass es unmöglich ist, Alipay zu täuschen: Das Ändern der Haarfarbe, des Make-ups und der Verwendung einer Perücke ändert nichts. Das System verwendet eine Reihe von Unterscheidungsmerkmalen, die die Geometrie des Gesichts und die Position bestimmter Punkte darauf berücksichtigen.

Schlussfolgerungen


Das Ausmaß der Direktinvestitionen westlicher Unternehmen und Chinas in Gesichtserkennungstechnologien ist enorm. Die Umsetzung solcher Projekte in Russland ist jedoch eine Frage der Zeit. Große Handelsunternehmen verstehen bereits die Vorteile und wirtschaftlichen Vorteile. Wenn wir die Gesichtserkennung als Produkt betrachten, ist es wichtig zu verstehen, dass jedes Segment des Geschäfts seine eigenen Besonderheiten hat, einschließlich des Preises. Je größer das Unternehmen, desto mehr Kameras und Analysemodule sind möglicherweise erforderlich. Lösungen für große Unternehmen sind immer komplexe kundenspezifische Projekte, und für die Anpassung sind zusätzliche Mittel erforderlich. Mittlere und kleine Unternehmen können problemlos mit einer Kamera mit angeschlossenem Gesichtserkennungsmodul arbeiten. In diesem Fall sind die Kosten der Lösung vergleichbar mit der Verwendung der Cloud-Videoüberwachung.

Source: https://habr.com/ru/post/de443906/


All Articles