Cérebros estúpidos, emoções ocultas, algoritmos insidiosos: a evolução do reconhecimento facial

imagem

Os antigos egípcios sabiam muito sobre vivissecção e podiam tocar o fígado a partir dos rins pelo toque. Múmias enroladas da manhã até a noite e praticando medicina (da trepanação à remoção de tumores), você inevitavelmente aprenderá a entender a anatomia.

A riqueza dos detalhes anatômicos foi mais do que compensada pela confusão com a compreensão da função dos órgãos. Padres, médicos e pessoas comuns ousadamente colocavam a mente no coração, e o cérebro recebia o papel de produtor de muco para o nariz.

Depois de quatro mil anos, é difícil se dar ao luxo de rir de fellahs e faraós - nossos computadores e algoritmos de coleta de dados parecem mais legais que os pergaminhos de papiro, e o cérebro ainda produz misteriosamente não entende isso.

Portanto, neste artigo, supunha-se que os algoritmos para reconhecer emoções atingissem a velocidade dos neurônios-espelho na interpretação dos sinais do interlocutor, quando de repente ficou claro que as células nervosas não eram o que aparentavam.

Erros de decisão


Na infância, a criança monitora o rosto dos pais e aprende a reproduzir um sorriso, raiva, complacência e outras emoções, de modo que, ao longo da vida em diferentes situações, sorria, franze a testa e fique com raiva - assim como seus entes queridos.

Muitos pesquisadores acreditam que a emulação de emoções é construída por um sistema de neurônios-espelho. No entanto, alguns cientistas expressam ceticismo em relação a essa teoria: ainda não entendemos a função de todas as células cerebrais.

O modelo do cérebro é baseado no terreno instável das hipóteses. Não é necessário duvidar de apenas uma coisa: o “firmware” da substância cinzenta desde o nascimento contém recursos e bugs, ou melhor, recursos que afetam o comportamento.

Espelho ou outros neurônios são responsáveis ​​pela resposta de imitação; esse sistema funciona apenas em um nível básico de reconhecimento das intenções e ações mais simples. Isso é suficiente para uma criança, mas muito pouco para um adulto.

Sabemos que as emoções dependem amplamente da experiência adquirida na interação de uma pessoa com sua cultura nativa. Ninguém o considerará um psicopata se, entre as pessoas alegres, você sorrir, sentir dor, porque na idade adulta as emoções são usadas como um meio de se adaptar às condições de vida.

Não sabemos o que a outra pessoa realmente pensa. Fazer suposições é fácil: ele sorri, o que significa que ele se diverte . A razão tem a propriedade inata de erguer castelos no ar de imagens consistentes do que está acontecendo.

É preciso apenas tentar determinar como as suposições existentes correspondem à verdade, como o solo instável das hipóteses se moverá: um sorriso - tristeza, carranca - felicidade, tremor nas pálpebras - prazer.

imagem

O psiquiatra alemão Franz Karl Muller-Layer, em 1889, mostrou uma ilusão geométrica-óptica associada a uma distorção na percepção de linhas e figuras. A ilusão é que o segmento emoldurado pelas pontas voltadas para fora parece ser mais curto que o segmento emoldurado por “caudas”. De fato, o comprimento de ambos os segmentos é o mesmo.

O psiquiatra também chamou a atenção para o fato de que o contemplador da ilusão, mesmo depois de medir as linhas e ouvir a explicação do fundo neurológico da percepção da imagem, continua a considerar uma linha mais curta que a outra. Também é interessante que essa ilusão não pareça a mesma para todos - existem pessoas menos suscetíveis a ela.

O psicólogo Daniel Kahneman afirma que nossa mente analítica lenta reconhece o truque de Müller-Layer, mas a segunda parte da mente, responsável pelo reflexo cognitivo, responde automática e quase instantaneamente a um estímulo que surge e faz julgamentos errôneos.

Um erro cognitivo não é apenas um erro. Você pode entender e admitir que, ao olhar para uma ilusão de ótica, não pode confiar em seus olhos, mas se comunicar com pessoas reais é como viajar por um labirinto intrincado.

Já em 1906, o sociólogo William Sumner proclamou a universalidade da seleção natural e a luta pela existência, transferindo os princípios da existência de animais para a sociedade humana. Na sua opinião, as pessoas agrupadas elevam seu próprio grupo, recusando-se a analisar os fatos que ameaçam a integridade da comunidade.

O psicólogo Richard Nisbett em seu artigo “Contando mais do que podemos saber: relatórios verbais sobre processos mentais” demonstra a relutância das pessoas em acreditar em dados estatísticos e outros dados geralmente aceitos que não são consistentes com suas crenças existentes.

A magia dos grandes números



Assista a este vídeo e veja como a expressão facial do ator muda.

A mente rapidamente “rotula” e faz suposições diante de dados insuficientes, o que leva a efeitos paradoxais, claramente visíveis no exemplo da experiência conduzida pelo diretor Lev Kuleshov.

Em 1929, ele filmou um close de um ator, uma tigela cheia de sopa, uma criança em um caixão, uma jovem garota no sofá. Em seguida, o filme com o plano do ator foi cortado em três partes e colado separadamente com molduras mostrando um prato com sopa, uma criança e uma menina.

Independentemente uma da outra, a platéia conclui que no primeiro fragmento o herói quer comer, no segundo - ele fica triste com a morte da criança, no terceiro - ele fica fascinado pela garota deitada no sofá.

Na realidade, a expressão no rosto do ator não muda em todos os casos.

E se você visse cem quadros, o truque seria revelado?

imagem

Com base em dados sobre a confiabilidade estatística do comportamento não verbal em grandes grupos de pessoas, o psicólogo Paul Ekman criou uma ferramenta abrangente para a medição objetiva dos movimentos faciais - o "sistema de codificação de movimentos faciais".

Ele é da opinião de que redes neurais artificiais podem ser usadas para analisar automaticamente expressões faciais de pessoas. Apesar de críticas sérias (o programa desenvolvido por Ekman para o serviço de segurança aeroportuária não passou em ensaios controlados), há um certo senso comum nesses argumentos.

Olhando para um homem sorridente, podemos assumir que ele está enganando e, de fato, ele concebeu um homem mau. Mas se você (ou a câmera) vê uma centena de pessoas sorridentes, provavelmente a maioria delas está realmente se divertindo - por exemplo, elas assistem ao desempenho de um comediante incendiário.

No exemplo de grandes números, não é tão importante que algumas pessoas saibam manipular emoções com tanta inteligência que até o professor Ekman será enganado. Nas palavras do especialista em risco Nassim Taleb, a antifragilidade do sistema aumenta significativamente quando uma câmera fria e imparcial se torna objeto de observação.

Sim, não sabemos como reconhecer uma mentira na cara - com ou sem inteligência artificial. Mas entendemos perfeitamente como determinar o nível de felicidade para centenas ou mais pessoas.

Reconhecimento de emoções para empresas


imagem
A maneira mais fácil de determinar emoções a partir de uma imagem de rosto é baseada na classificação de pontos-chave, cujas coordenadas podem ser obtidas usando vários algoritmos. Geralmente marque algumas dezenas de pontos, amarrando-os na posição das sobrancelhas, olhos, lábios, nariz, mandíbula, o que permite capturar expressões faciais.

A avaliação do contexto emocional usando algoritmos de máquina agora ajuda os varejistas a integrar online o máximo possível offline. A tecnologia permite avaliar a eficácia das campanhas de publicidade e marketing, determinar a qualidade do serviço e do atendimento ao cliente e identificar comportamentos anormais das pessoas.

Usando algoritmos, é possível rastrear o estado emocional dos funcionários no escritório (um escritório com pessoas tristes é um escritório de fraca motivação, tristeza e corrupção) e o "índice de felicidade" de funcionários e clientes na entrada e saída.

O Alfa-Bank, em várias filiais, lançou um projeto piloto para analisar as emoções dos clientes em tempo real. Os algoritmos constroem um indicador integral da satisfação do cliente, identificam tendências na percepção emocional de visitar uma filial e fornecem uma avaliação geral da visita.

A Microsoft falou sobre o teste de um sistema para analisar o estado emocional dos espectadores em um cinema (uma avaliação objetiva da qualidade do filme em tempo real), bem como para determinar o vencedor na indicação "Audience Award" na competição Imagine Cup (a equipe obteve a resposta à qual o público reagiu mais positivamente).

Tudo isso é apenas o começo de uma nova era. Na Universidade da Carolina do Norte, durante os cursos educacionais, os rostos dos alunos foram filmados por uma câmera, cujo vídeo foi analisado por um sistema de visão computacional que reconhece emoções. Com base nos dados recebidos, os professores modificaram a estratégia de aprendizagem.

No processo educacional, em geral, atenção insuficiente é dada à avaliação das emoções. Mas você pode avaliar a qualidade do ensino, o envolvimento dos alunos, identificar emoções negativas e planejar o processo educacional com base nas informações recebidas.

Reconhecimento facial Ivideon: demografia e emoções


imagem

Agora, um relatório sobre emoções apareceu em nosso sistema.

Um campo separado "Emoção" apareceu nos cartões de eventos de detecção de rosto e, na guia "Relatórios" na seção "Rostos", um novo tipo de relatório está disponível - por horas e dias:

imagem
imagem

É possível fazer o upload dos dados de origem de todas as detecções e formar seus próprios relatórios com base.

Até recentemente, todos os sistemas de reconhecimento de emoções operavam no nível de projetos experimentais, que eram testados com cautela. O custo de tais pilotos era muito alto.

Queremos fazer da análise parte do mundo familiar de serviços e dispositivos, para que, a partir de agora, "emoções" estejam disponíveis para todos os clientes da Ivideon. Não introduzimos um plano tarifário especial, não fornecemos câmeras especiais e, de todas as formas possíveis, nivelamos todas as barreiras possíveis. As tarifas permanecem inalteradas, todos podem conectar a análise de emoções ao reconhecimento facial por 1.700 rublos. por mês.

O serviço é apresentado na conta pessoal do usuário. E na página promocional, reunimos fatos ainda mais interessantes sobre o sistema de reconhecimento de rosto Ivideon.

Source: https://habr.com/ru/post/pt458666/


All Articles