Das neuronale Netzwerk sagt den ersten Eindruck einer Person durch sein Gesicht voraus


Das Ergebnis der Verarbeitung von Fotos von Julian Assange und Benedict Cumberbatch mit einem neuronalen Netzwerk, um den ersten Eindruck einer Person vorherzusagen. Es gibt einen leichten Mangel an subjektiver Intelligenz und Dominanz des Schauspielers im Vergleich zu dem Helden, den er im Film "Fifth Power" gespielt hat. Ansonsten wurde das Bild von Assange ganz korrekt übertragen. Abbildung: Universität Notre Dame, Harvard University

Unser Gehirn kann schnell einen Fremden durch sein Gesicht beeindrucken. In wenigen Sekunden werden die Schlüsselmerkmale einer Person bestimmt: Attraktivität, Intelligenz, Alter, Zuverlässigkeit, sozialer Status (Dominanz), Geselligkeit und moralisches Niveau. Es ist klar, dass dieser Eindruck ungenau und manchmal völlig falsch ist. Absolute Genauigkeit ist hier nicht erforderlich. Geschwindigkeit ist wichtig. Dies ist ein absolut notwendiger sozialer Mechanismus, ohne den es schwierig ist, in der Gesellschaft zu überleben, eine wichtige Fähigkeit. Daher ist der erste Eindruck so stark und wichtig. Eine spätere Änderung ist sehr schwierig.

Abgesehen von der offensichtlichen Tendenz des ersten Eindrucks ist es wichtig, Computern beizubringen, wie man Gesichter auf die gleiche Weise bewertet wie andere Menschen. Solche Versuche wurden wiederholt gemacht. Die Forscher versuchten algorithmisch, verschiedene Emotionen nach dem Gesicht einer Person zu kategorisieren , einschließlich der Verwendung neuronaler Netze . Veröffentlichte Arbeiten zur automatischen Bestimmung der Attraktivität einer Person sowie zum Vorhandensein von Sinn für Humor und anderen persönlichen Merkmalen einer Person , die neuronale Netze verwendet.

Alle diese Studien sind ein absolut notwendiger Teil der Arbeit, um künstliche Intelligenz auf menschlicher Ebene zu schaffen. KI sollte in der Lage sein, Gesichter nicht schlechter als Menschen zu lesen und subjektive Bewertungen von Gesichtern nicht schlechter als Menschen vorzunehmen.

Jetzt hat eine Gruppe von Forschern der University of Notre Dame (USA) und der Harvard University (USA) eine neue Studie durchgeführt, die die wissenschaftlichen Entwicklungen auf dem Gebiet der Sozialpsychologie ergänzen wird. Ihre Arbeit widmet sich der automatischen Zusammenstellung des ersten Eindrucks, der über eine Person von anderen entsteht. Die Analyse wird von einem neuronalen Netzwerk durchgeführt, das auf Probenfotos trainiert ist.

Laut PsychologenBei der erstmaligen Beurteilung eines Fremden im Gesicht einer Person sind zwei Merkmale entscheidend: Zuverlässigkeit und Dominanz. Alle anderen Merkmale lassen sich nach Alexander Todorov aus diesen beiden Hauptmerkmalen ableiten. Psychologen haben lange Zeit eine Reihe grundlegender Merkmale zusammengestellt, die die Dominanz einer Person gegenüber anderen Menschen demonstrieren, einschließlich der Neigung des Kopfes, der Gesten der Augenbrauen und des Mundes.

Wissenschaftler der University of Notre Dame und der Harvard University trainierten ein neuronales Netzwerk an einer Stichprobe von 6300 Fotos aus den gemeinfreien Annotated Facial Landmarks in the Wild . Diese Fotos wurden von Benutzern der Crowdsourcing-Plattform TestMyBrain.org kommentiertnach drei sozialen Attributen: Dominanz, Zuverlässigkeit und IQ sowie einem zusätzlichen Attribut - Alter.

6.000 Fotos wurden für das Training verwendet, weitere 200 für die Feinabstimmung und Feinabstimmung und die letzten 100 für die Überprüfung des neuronalen Netzwerks.


Das fast perfekte Zusammentreffen der Profile von Edward Snowden und dem Schauspieler Joseph Gordon-Levitt, der ihn im Film Snowden spielt. Abbildung: Universität Notre Dame, Harvard University

Wissenschaftler stellen fest, dass sie je nach IQ-Attributen und Alter Anmerkungen mit realen, nicht subjektiven Merkmalen machen können. Aber dann würde das neuronale Netzwerk lernen, den tatsächlichen IQ und das Alter eines Menschen anhand seines Gesichts zu bestimmen. Wie oben erwähnt, war die Aufgabe völlig anders, daher wurden beim Training neuronaler Netze auch IQ-Kategorien und Alter mithilfe von Crowdsourcing zugewiesen.

Die Abbildung zeigt einzelne Fotos von der Basis, die für das Training verwendet wurde. Die Proben werden unter den Eigentümern der minimalen, durchschnittlichen und maximalen Merkmale in allen Kategorien ausgewählt. Wie Sie sehen können, haben kleine Kinder die niedrigsten Werte in den Kategorien IQ, Dominanz und Alter. Eine Person mit einem bemalten Gesicht - eine der Mindestbewertungen für Zuverlässigkeit.



Die Verteilung der Indikatoren im Trainingsdatensatz liegt nahe an der Normalverteilung.



Die Tabelle zeigt die durchschnittlichen Bewertungen von Fotos in vier Kategorien, die anhand der Ergebnisse der Benutzerbewertungen zusammengestellt wurden. Es werden minimale und maximale Bewertungen sowie die durchschnittliche Anzahl der Bewertungen angegeben. Jede Person erhielt durchschnittlich 32 Bewertungen für Dominanz und Zuverlässigkeit sowie 15 Bewertungen für Alter und IQ.



Nach dem Training zeigte das neuronale Netzwerk eine ziemlich genaue Bewertung von Personen, nahe an den Ergebnissen der Bewertungen von Site-Benutzern.



Die Autoren hoffen, dass ihr neuronales Netzwerk bei der Entwicklung von Computer-Vision-Programmen nützlich sein wird. Ein solches System kann den Videostream in Echtzeit analysieren. Zum Beispiel, um auf dem Bildschirm in Form eines Diagramms zu zeigen, wie sich die subjektiv wahrgenommene Intelligenz der Person des führenden Fernsehprogramms im Laufe der Zeit ändert. Das heißt, wie schlau sein Gesicht zu bestimmten Zeitpunkten aussieht. Stellen Sie sich vor, das Programm würde die interessantesten Momente der Übertragung zusammenfassen, wenn das Gesicht des Moderators am dümmsten aussah.



Bei der Videoverarbeitung verarbeitet das neuronale Netzwerk jeden Frame einzeln.

Sie können sich andere Anwendungen dieser Technologie einfallen lassen. Zum Beispiel, um Schauspieler auszuwählen, die den subjektiven Eindruck des Auftretens ihrer Helden im wirklichen Leben am genauesten vermitteln, wie in den zuvor erwähnten Beispielen mit Julian Assange und Edward Snowden gezeigt.

Wahrscheinlich wird ein solches neuronales Netzwerk in persönlichen Wachstumsprogrammen Anwendung finden: Durch Ändern des Gesichtsausdrucks vor der Kamera wird eine Person trainieren, wie sie in den Augen anderer fester und klüger werden kann - indem sie die Beurteilung ihres Gesichts durch ein neuronales Netzwerk beobachtet.

Man kann sich vorstellen, dass einige Unternehmen anfangen werden, Mitarbeiter zu rekrutieren, basierend auf den Ergebnissen einer subjektiven Beurteilung der Gesichter der Kandidaten. Das heißt, beim Training eines neuronalen Netzwerks wählt der Chef mehrere Dutzend Personen aus, die er in Bezug auf IQ und Zuverlässigkeit mag, und das Programm findet Kandidaten mit genau den Eigenschaften, die der Chef benötigt.

Forscher warnen nur, dass die Genauigkeit eines neuronalen Netzwerks direkt von der Qualität der Quelldaten abhängt, dh von den Bewertungen einzelner Personen. Es ist wichtig, dass diese Bewertung von Vertretern der Zielgruppe durchgeführt wird. Tatsache ist, dass der Eindruck einer Person stark von der Persönlichkeit der Person abhängt, die die Bewertung abgibt: ihrer Kultur und Nationalität. Grob gesagt wird eine sehr autoritäre und weise Person im Zulu-Stamm nicht als der dominierende Führer in der Gemeinschaft der Oxford-Aristokraten wahrgenommen.

Die wissenschaftliche Arbeit veröffentlicht 25. Oktober 2016 auf der Website arXiv.org .

Source: https://habr.com/ru/post/de398789/


All Articles