A rede neural prevê a primeira impressão de uma pessoa pelo seu rosto


O resultado do processamento de fotos de Julian Assange e Benedict Cumberbatch com uma rede neural para prever a primeira impressão de uma pessoa. Há uma ligeira falta de inteligência subjetiva e domínio do ator em comparação com o herói que ele interpretou no filme "Fifth Power". Caso contrário, a imagem de Assange foi transferida corretamente. Ilustração: Universidade de Notre Dame, Universidade de Harvard

Nosso cérebro é capaz de rapidamente impressionar o rosto de um estranho. Em alguns segundos, são determinadas as principais características de uma pessoa: sua atratividade, inteligência, idade, confiabilidade, status social (domínio), sociabilidade e nível moral. É claro que essa impressão é imprecisa e, às vezes, completamente errada. Precisão absoluta não é necessária aqui. A velocidade é importante. Esse é um mecanismo social absolutamente necessário, sem o qual é difícil sobreviver na sociedade, uma habilidade vital. Portanto, a primeira impressão é tão forte e importante. Mudar mais tarde é muito difícil.

Deixando de lado o viés óbvio da primeira impressão, é importante ensinar aos computadores como avaliar os rostos da mesma maneira que outras pessoas. Tais tentativas foram feitas repetidamente. Os pesquisadores tentaram algoritmicamente categorizar várias emoções de acordo com o rosto de uma pessoa, incluindo o uso de redes neurais . Publicado trabalhos sobre a determinação automática da atratividade de uma pessoa , bem como a presença de um senso de humor e outras características pessoais de uma pessoa que usa redes neurais.

Todos esses estudos são uma parte absolutamente necessária do trabalho para criar inteligência artificial do nível humano. A IA deve ser capaz de ler rostos não piores que os humanos e fazer avaliações subjetivas de rostos não piores que os humanos.

Agora, um grupo de pesquisadores da Universidade de Notre Dame (EUA) e da Universidade de Harvard (EUA) realizou um novo estudo que complementará os desenvolvimentos científicos no campo da psicologia social. Seu trabalho é dedicado à compilação automática da primeira impressão que surge sobre uma pessoa de outras pessoas. A análise é realizada por uma rede neural treinada em fotografias de amostra.

De acordo com psicólogos, que se especializam em estudar o sistema de classificações sociais nas pessoas, a primeira avaliação de um estranho diante da chave são duas características: confiabilidade e dominância. Segundo Alexander Todorov, todas as outras características podem ser derivadas dessas duas principais. Os psicólogos há muito tempo compilam um conjunto de características básicas que demonstram o domínio de uma pessoa sobre outras, incluindo a inclinação da cabeça, gestos das sobrancelhas e boca.

Cientistas da Universidade de Notre Dame e da Universidade de Harvard treinaram uma rede neural em uma amostra de 6300 fotos do domínio público Annotated Facialmarks in the Wild . Essas fotos foram anotadas pelos usuários da plataforma de crowdsourcing TestMyBrain.orgde acordo com três atributos sociais: dominância, confiabilidade e QI, além de um atributo adicional - idade.

6.000 fotos foram usadas para treinamento, outras 200 para ajuste fino e ajuste fino e as 100 últimas para verificação da rede neural.


A quase perfeita coincidência dos perfis de Edward Snowden e do ator Joseph Gordon-Levitt interpretando-o no filme Snowden. Ilustração: Universidade de Notre Dame, Universidade de Harvard

Os cientistas observam que, de acordo com os atributos de QI e a idade, eles poderiam fazer anotações com características reais e não subjetivas. Mas então a rede neural aprenderia a determinar o QI real e a idade de uma pessoa pelo seu rosto. Como mencionado acima, a tarefa era completamente diferente, portanto, para o treinamento de redes neurais, categorias de QI e idade também foram atribuídas usando o crowdsourcing.

A ilustração mostra fotografias individuais da base que foram usadas para treinamento. As amostras são selecionadas entre os proprietários das características mínimas, médias e máximas em todas as categorias. Como você pode ver, as crianças pequenas têm as pontuações mais baixas nas categorias de QI, dominância e idade. Uma pessoa com o rosto pintado - uma das classificações mínimas de confiabilidade.



A distribuição dos indicadores no conjunto de dados de treinamento está próxima da distribuição normal.



A tabela mostra as classificações médias de fotografias em quatro categorias, compiladas de acordo com os resultados das classificações dos usuários. As classificações mínima e máxima são indicadas, bem como o número médio de classificações fornecidas. Cada pessoa recebeu, em média, 32 classificações por domínio e confiabilidade, além de 15 classificações por idade e QI.



Após o treinamento, a rede neural mostrou uma avaliação bastante precisa dos indivíduos, próxima aos resultados das avaliações dos usuários do site.



Os autores esperam que sua rede neural seja útil no desenvolvimento de programas de visão computacional. Esse sistema pode analisar o fluxo de vídeo em tempo real. Por exemplo, mostrar na tela na forma de gráfico como a inteligência subjetiva percebida da pessoa do programa de televisão principal muda com o tempo. Ou seja, quão esperto seu rosto parece em determinados momentos no tempo. Imagine que o programa faça um resumo dos momentos mais interessantes da transferência, quando o rosto do apresentador parecia mais estúpido.



Ao processar o vídeo, a rede neural processa cada quadro individualmente.

Você pode criar outros aplicativos dessa tecnologia. Por exemplo, para selecionar atores que transmitam com mais precisão a impressão subjetiva da aparência de seus heróis na vida real, como mostrado nos exemplos mencionados anteriormente com Julian Assange e Edward Snowden.

Provavelmente, essa rede neural encontrará aplicação em programas de crescimento pessoal: mudando a expressão facial na frente da câmera, uma pessoa treinará como se tornar mais sólida e inteligente aos olhos dos outros - observando a avaliação de seu rosto por uma rede neural.

Pode-se imaginar que algumas empresas começarão a recrutar funcionários com base nos resultados de uma avaliação subjetiva do rosto dos candidatos. Ou seja, ao treinar uma rede neural, o chefe seleciona várias dezenas de pessoas de quem gosta em termos de QI e confiabilidade, e o programa encontra candidatos com exatamente as mesmas características que o chefe precisa.

Os pesquisadores alertam apenas que a precisão da rede neural depende da qualidade dos dados de origem, ou seja, das classificações dos indivíduos. É importante que essa avaliação seja realizada por representantes do público-alvo. O fato é que a impressão de uma pessoa depende muito da personalidade da pessoa que atribui a classificação: sua cultura e nacionalidade. Grosso modo, uma pessoa muito autoritária e sábia na tribo Zulu não será vista como o líder dominante na comunidade dos aristocratas de Oxford.

O trabalho científico foi publicado em 25 de outubro de 2016 no site arXiv.org .

Source: https://habr.com/ru/post/pt398789/


All Articles