Le réseau neuronal prédit la première impression d'une personne par son visage


Le résultat du traitement des photos de Julian Assange et Benedict Cumberbatch avec un réseau neuronal pour prédire la première impression d'une personne. Il y a un léger manque d'intelligence subjective et de domination de l'acteur par rapport au héros qu'il a joué dans le film "Fifth Power". Sinon, l'image d'Assange a été transférée assez correctement. Illustration: Université de Notre Dame, Université de Harvard

Notre cerveau est capable de faire rapidement une impression d'un étranger par son visage. En quelques secondes, les principales caractéristiques d'une personne sont déterminées: son attractivité, son intelligence, son âge, sa fiabilité, son statut social (dominance), sa sociabilité et son niveau moral. Il est clair que cette impression est inexacte, et parfois complètement fausse. Une précision absolue n'est pas requise ici. La vitesse est importante. Il s'agit d'un mécanisme social absolument nécessaire, sans lequel il est difficile de survivre dans la société, une compétence vitale. Par conséquent, la première impression est si forte et importante. Le changer plus tard est très difficile.

Mis à part le biais évident de la première impression, il est important d'enseigner aux ordinateurs comment évaluer les visages de la même manière que les autres. De telles tentatives ont été faites à plusieurs reprises. Les chercheurs ont tenté de classer par algorithme diverses émotions en fonction du visage d'une personne, notamment en utilisant des réseaux de neurones . Travaux publiés sur la détermination automatique de l'attractivité d'une personne , ainsi que la présence d'un sens de l'humour et d'autres caractéristiques personnelles d'une personne utilisant des réseaux de neurones.

Toutes ces études sont une partie absolument nécessaire du travail pour créer l'intelligence artificielle du niveau humain. L'IA devrait être capable de lire les visages pas pire que les humains et de faire des évaluations subjectives des visages pas pire que les humains.

Aujourd'hui, un groupe de chercheurs de l'Université de Notre Dame (USA) et de l'Université Harvard (USA) a mené une nouvelle étude qui complétera les développements scientifiques dans le domaine de la psychologie sociale. Leur travail est consacré à la compilation automatique de la première impression qui surgit d'une personne d'autrui. L'analyse est réalisée par un réseau de neurones formé sur des échantillons de photographies.

Selon les psychologues, qui se spécialisent dans l'étude du système de notation sociale chez les personnes, la première évaluation d'un étranger face à la clé sont deux caractéristiques: la fiabilité et la dominance. Selon Alexander Todorov, toutes les autres caractéristiques peuvent être dérivées de ces deux principales. Les psychologues ont depuis longtemps compilé un ensemble de caractéristiques de base qui démontrent la domination d'une personne sur les autres, notamment l'inclinaison de la tête, les gestes des sourcils et de la bouche.

Des scientifiques de l'Université Notre Dame et de l'Université Harvard ont formé un réseau de neurones sur un échantillon de 6300 photos du domaine public Annotated Facial Monuments in the Wild . Ces photos ont été annotées par les utilisateurs de la plateforme de crowdsourcing TestMyBrain.orgselon trois attributs sociaux: la dominance, la fiabilité et le QI, ainsi qu'un attribut supplémentaire - l'âge.

6000 photos ont été utilisées pour la formation, 200 autres pour le réglage fin et le réglage fin, et les 100 dernières pour vérifier le réseau neuronal.


La coïncidence presque parfaite des profils d'Edward Snowden et de l'acteur Joseph Gordon-Levitt le jouant dans le film Snowden. Illustration: Université de Notre Dame, Université de Harvard

Les scientifiques notent que selon les attributs et l'âge du QI, ils pourraient faire des annotations avec des caractéristiques réelles et non subjectives. Mais alors le réseau neuronal apprendrait à déterminer le vrai QI et l'âge d'une personne par son visage. Comme mentionné ci-dessus, la tâche était complètement différente, par conséquent, pour la formation des réseaux de neurones, les catégories de QI et l'âge ont également été attribués à l'aide du crowdsourcing.

L'illustration montre des photographies individuelles de la base qui ont été utilisées pour la formation. Les échantillons sont sélectionnés parmi les propriétaires des caractéristiques minimales, moyennes et maximales dans toutes les catégories. Comme vous pouvez le voir, les jeunes enfants ont les scores les plus bas dans les catégories de QI, de dominance et d'âge. Une personne avec un visage peint - l'une des cotes minimales de fiabilité.



La distribution des indicateurs dans l'ensemble de données d'apprentissage est proche de la distribution normale.



Le tableau montre les notes moyennes des photographies dans quatre catégories, compilées en fonction des résultats des notes des utilisateurs. Les notes minimales et maximales sont indiquées, ainsi que le nombre moyen de notes données. Chaque personne a reçu, en moyenne, 32 notes pour la dominance et la fiabilité, ainsi que 15 notes pour l'âge et le QI.



Après la formation, le réseau neuronal a montré une évaluation assez précise des individus, proche des résultats des évaluations des utilisateurs du site.



Les auteurs espèrent que leur réseau neuronal sera utile dans le développement de programmes de vision par ordinateur. Un tel système peut analyser le flux vidéo en temps réel. Par exemple, pour montrer à l'écran sous forme de graphique comment l'intelligence subjectivement perçue de la personne de la principale émission de télévision change au fil du temps. Autrement dit, à quel point son visage est intelligent à certains moments. Imaginez que le programme fasse un résumé des moments les plus intéressants du transfert, lorsque le visage du présentateur avait l'air le plus stupide.



Lors du traitement de la vidéo, le réseau neuronal traite chaque image individuellement.

Vous pouvez trouver d'autres applications de cette technologie. Par exemple, pour sélectionner des acteurs qui transmettent le plus fidèlement l'impression subjective de l'apparition de leurs héros dans la vie réelle, comme le montrent les exemples mentionnés précédemment avec Julian Assange et Edward Snowden.

Probablement, un tel réseau neuronal trouvera une application dans les programmes de croissance personnelle: en changeant l'expression faciale devant la caméra, une personne apprendra comment devenir plus solide et intelligent aux yeux des autres - en observant l'évaluation de son visage par un réseau neuronal.

On peut imaginer que certaines entreprises vont commencer à recruter des employés sur la base des résultats d'une évaluation subjective des visages des candidats. Autrement dit, lors de la formation d'un réseau de neurones, le patron sélectionne plusieurs dizaines de personnes qu'il aime en termes de QI et de fiabilité, et le programme trouve des candidats avec exactement les caractéristiques dont le patron a besoin.

Les chercheurs avertissent seulement que la précision d'un réseau neuronal dépend directement de la qualité des données sources, c'est-à-dire des évaluations des individus. Il est important que cette évaluation soit effectuée par des représentants du public cible. Le fait est que l'impression d'une personne dépend fortement de la personnalité de la personne qui donne la note: sa culture et sa nationalité. En gros, une personne très autoritaire et sage de la tribu zoulou ne sera pas perçue comme le leader dominant dans la communauté des aristocrates d'Oxford.

L'ouvrage scientifique a été publié le 25 octobre 2016 sur le site arXiv.org .

Source: https://habr.com/ru/post/fr398789/


All Articles