Colhedores de análise de vídeo: o que o cérebro e as máquinas fazem com nossos rostos

imagem

A capacidade de ver e reconhecer rostos rapidamente é uma superpotência. Não há necessidade de gastar tempo analisando, estudando rugas, dobras e ovais. O reconhecimento de rosto é instantâneo e sem esforço. É tão fácil que não percebemos como o fazemos.

Pense em como diferentes rostos se parecem - dois olhos, uma boca, um nariz, orelhas saindo dos lados, sempre na mesma ordem (na maioria das vezes). É incrível que analisemos um objeto com tanta facilidade.

Somos "programados" para reconhecer rostos desde o nascimento, mas agora as pessoas conseguiram mais - elas ensinaram à máquina essa habilidade. Como a ampla implementação dos sistemas de reconhecimento e identificação de pessoas afetará a sociedade?

Pareidolia: pesquisa automática de rosto


imagem

As pessoas no modo "automático" são capazes de distinguir imagens familiares em qualquer superfície. Apenas três elementos arquitetônicos do edifício são percebidos como o rosto de um pato surpreso. Este é um exemplo de pareidolia.

A palavra pareidolia vem das palavras gregas para (para - próximo, próximo, desvio de qualquer coisa) e eidolon - imagem. Este é o nome de uma ilusão de ótica, a percepção de uma imagem ou significado onde realmente não estão. Por exemplo, um rosto em um tronco de árvore ou figuras de animais nas nuvens é uma pareidólia.

imagem
Mais fotos podem ser encontradas em thingswithfaces.com

Os rostos das pessoas e os rostos dos animais que vemos em qualquer figura geométrica. Toda a cultura emoji é construída sobre esse princípio. :-)

imagem

O fenômeno da pareidolia é facilmente traduzido para a linguagem dos algoritmos. Os artistas de Shinseungback Kimyonghun fotografaram nuvens, fundindo-se por um momento em rostos humanos, usando um script com a biblioteca OpenCV.

Ilusão de Thatcher: Erros biológicos do sistema


imagem

Há um erro biológico que mostra a grande importância da habilidade de reconhecimento . A maioria dos objetos ao seu redor - uma cadeira, uma mesa, um computador - é fácil de ver e identificar corretamente de qualquer ângulo. Apenas não rostos.

O rosto invertido causa um mau funcionamento no cérebro chamado efeito Thatcher (ilusão). O fenômeno descreve uma condição na qual é difícil detectar alterações locais em uma foto de retrato invertida.

Vire a foto de Margaret Thatcher e veja o resultado.
imagem

A primeira foto parece normal, mas se você a virar, a posição incorreta dos olhos e da boca chama a atenção imediatamente. O homem e uma rede neural artificial percebem imagens de diferentes maneiras. É incrível que a "rede neural" entre nossos ouvidos seja tão fácil de enganar.

A ilusão de Thatcher demonstra alguns mecanismos básicos pelos quais nosso cérebro processa informações. O cérebro lê um conjunto de elementos individuais: um par de olhos, nariz, boca, ouvidos. Além das características individuais das características faciais, são levadas em consideração a relação entre elas e a localização. Ou seja, uma pessoa é percebida como um sistema inteiro.

Portanto, quando é mostrada uma face invertida, é mais difícil para o cérebro avaliar a imagem inteira - as informações são "coletadas" separadamente para cada elemento: os olhos estão no lugar, a boca é como uma boca. No entanto, assim que é mostrada a face certa, de repente a percepção de um único sistema se reconecta e os problemas começam: fica claro que os recursos familiares são interconectados de uma maneira incomum.

Por que isso é importante? O cérebro humano é capaz de reconhecer as menores diferenças nas características faciais devido à integridade da percepção. A área do córtex cerebral reconhece a face e determina a direção do olhar, a amígdala e o lóbulo da ilhota analisam a expressão facial, e a área na área pré-frontal do lobo frontal e o sistema cerebral responsável pela sensação de prazer avaliam sua beleza.

Um bug como um recurso: os rostos de Chernov


imagem
c )

A peculiaridade da percepção humana é usada para analisar dados multidimensionais agregados usando "faces". Em 1973, o matemático americano German Chernov delineou o conceito de usar “pessoas” para identificar relacionamentos característicos e estudar relacionamentos complexos entre várias variáveis.

Os dados de Chernov são refletidos na forma de pictogramas de faces, onde os valores relativos das variáveis ​​selecionadas são apresentados como as formas e tamanhos das características individuais: comprimento do nariz, ângulo entre as sobrancelhas, largura da face - até 36 variáveis ​​no total. Assim, o observador pode identificar características visuais de objetos que são únicos para cada configuração de valores.

Uma rápida olhada no diagrama composto de faces permitirá determinar rapidamente se as características dos perfis diferem significativamente (coincidem). Com uma revisão detalhada dos recursos faciais, fica claro em quais recursos (cada recurso facial é um recurso separado do conjunto de dados original) a semelhança e qual é a diferença. Por exemplo, na ilustração acima, é fácil notar a diferença entre países por emoticons tristes e engraçados.

Por que car seu rosto


imagem

A habilidade do reconhecimento rápido de rosto ajuda a pegar seu filho no jardim de infância, escolher um parceiro, expressar emoções corretamente e adequadamente. Mas o que acontece quando uma pessoa transfere essa capacidade para uma rede neural artificial?

Uma ideia pode causar rejeição. Nem todo mundo está pronto para aceitar facilmente a tecnologia que armazena dados, monitora movimentos, analisa compras e emoções. A transição da simples vigilância por vídeo para a análise de vídeo personalizada implica um aumento significativo de responsabilidade.

imagem

Atualmente, algoritmos como o DeepFace determinam as semelhanças de indivíduos com uma precisão maior que a dos humanos. O próprio algoritmo da Nvidia cria os rostos de pessoas inexistentes em alguns segundos. As faces na colagem acima são geradas pela rede neural StyleGAN, treinada em um conjunto de dados de 70.000 imagens. Eles parecem assustadoramente realistas.

imagem
Demonstração do algoritmo SearchFace

A princípio, o algoritmo de reconhecimento de rosto do Facebook causou maior alerta, mas todos se acostumaram (ou deixaram a rede social). O serviço FindFace para pesquisar pessoas em fotos no VKontakte recebeu críticas mistas e foi usado para o bullying, mas o encerramento do projeto SearchFace semelhante já causou uma reação negativa dos usuários - no final, se os dados estiverem disponíveis, deixe-os abertos a todos.

Os varejistas instalam a tecnologia de reconhecimento facial para evitar roubos, coletar dados sobre idade, sexo e até emoções dos clientes. No final, o objetivo é melhorar o atendimento ao cliente e capitalizá-lo. Quando os clientes percebem que o sistema é pessoalmente benéfico para eles, muitos concordam em introduzir novas tecnologias.

Dado o número crescente de casos de "roubo de identidade" - fraude com cartão de crédito e dados pessoais, os consumidores preferem o sistema no momento certo. identifica-os corretamente.

Atualmente, os algoritmos ajudam a resolver os problemas de baixa iluminação do quadro, baixa resolução e mascaramento - como óculos, perucas e cerdas de vários dias. Os sistemas estão funcionando a uma velocidade tremenda e mapeiam uma pessoa para um banco de dados de milhões de pessoas em apenas um segundo.

Algumas lojas nos Estados Unidos oferecem uma opção aos suspeitos de roubo: permita-se tirar uma foto ou receber uma acusação de crime formal. Um ladrão ganha liberdade junto com a proibição de fazer compras, e sua foto entra oficialmente no banco de dados. Os arquivos que contêm imagens de pessoas são criptografados e disponíveis apenas para o proprietário do sistema.

Quem lucra com o reconhecimento



A maioria das lojas já instalou câmeras de CFTV. Para análise de vídeo, a atualização de hardware não é necessária - basta conectar o serviço em nuvem. E com o serviço de análise de vídeo Ivideon, o limite de entrada é praticamente ausente. O custo da solução é de 1.700 rublos por câmera, o que dá a qualquer empresário acesso ao software.

O principal motivo para os varejistas usarem a tecnologia de reconhecimento de rosto é impedir o roubo. Segundo a National Retail Foundation, apenas nos Estados Unidos, cerca de 1,33% de todos os produtos em 2017 foram perdidos devido a roubo - nada menos que US $ 46,8 bilhões em danos.

A tecnologia de reconhecimento de rosto reduz o número de roubos em mais de 30%.

Frequentemente, fatores secundários influenciam a quantidade de danos: negligência dos funcionários, má preparação do serviço de segurança, desejo de economizar. Esses e outros problemas devem ser resolvidos com câmeras e tecnologia em nuvem.

O sistema de reconhecimento de rosto facilita o trabalho rápido com as listas negras: compara a foto do cliente com um banco de dados de pessoas não confiáveis ​​e, se corresponder, envia um aviso apropriado aos guardas.

O software analítico aumenta muito a segurança da loja. Um ladrão experiente é capaz de perceber os "pontos cegos" das câmeras. Nesse caso, o guarda pode usar o telefone para fotografar o suspeito e depois verificar se essa pessoa está no banco de dados.

As marcas usam o marketing para celular há muito tempo - elas enviam SMS, enviam notificações por push e mostram anúncios direcionados. Para o varejo tradicional, os sistemas de reconhecimento oferecem os mesmos recursos que os vendedores on-line com cookies receberam.

A mesma plataforma usada para identificar ladrões ajuda os vendedores a descobrir quais fachadas atraem melhor os clientes. O sistema de reconhecimento ajuda a identificar o cliente VIP logo na entrada da loja. Usando os dados do CRM, o vendedor pode rapidamente fazer do cliente uma oferta vantajosa.

imagem
No International Financial Center de Seul, as câmeras dos painéis de informações em tempo real determinam a idade e o sexo de uma pessoa e oferecem publicidade de acordo com os parâmetros identificados

As informações do cliente ativam uma ferramenta poderosa para aumentar as vendas e avaliar as necessidades do público. As câmeras ajudarão você a configurar a exibição de anúncios em vídeo para um visitante específico, dependendo de sexo, idade e estado emocional, além de se tornarem fornecedores de dados para calcular a eficácia da publicidade.

As oportunidades acima para varejistas costumam parecer um burburinho irritante de publicidade. As teses sobre "crescimento do lucro" e "necessidades do público-alvo" acompanham qualquer ferramenta de TI no mercado - do ERP ao preço eletrônico. Existe algo mais para enfrentar sistemas de reconhecimento do que marketing puro sobre inteligência artificial e tecnologias futuras? Responderemos a essa pergunta através de exemplos de uso de sistemas reais em lojas existentes.

“Trabalho no campo”: quem em condições reais reconhece rostos


imagem

A 7-Eleven é a maior rede de varejo do mundo, com a Seven-Eleven Japan gerenciando mais de 36.000 pequenas lojas em 18 países. A empresa instalou recentemente o software em 11.000 de suas lojas. A tecnologia de reconhecimento de rosto e análise de comportamento na rede de distribuição é usada para identificar os titulares de cartões de fidelidade, monitorar o tráfego de clientes, determinar o nível de estoques de mercadorias nos armazéns.

imagem

A Saks é uma cadeia centenária de lojas premium que atualmente pertence a uma das empresas mais antigas do mundo (fundada em 1670) pela Hudson's Bay Company. A Saks usa análise de vídeo principalmente para evitar roubo. O software verifica fotos de suspeitos de roubo em um banco de dados de ladrões conhecidos. As câmeras são conectadas em rede, para que os resultados possam ser vistos na sede da Saks em Nova York.

Segundo o Guardian, lojas e hotéis premium na Europa usam regularmente a tecnologia de reconhecimento de rosto para rastrear VIPs e celebridades e proporcionar-lhes as condições mais confortáveis.

imagem

Nos EUA, a CaliBurger Burger Network usa a tecnologia de reconhecimento de rosto em um programa de fidelidade. O quiosque interativo “reconhece” os clientes, lembra pedidos e oferece pratos favoritos, aceita pagamentos com identificação pelo rosto.

O sistema remove o limite de entrada no programa de bônus para pessoas idosas, que podem achar difícil usar o aplicativo móvel, pontos de bônus e cartões de crédito.

Os sistemas de reconhecimento de rosto são amplamente utilizados na Ásia, especialmente na China, onde são usados ​​para pagar comida, sacar dinheiro de um caixa eletrônico ou até tomar empréstimos. A precisão do reconhecimento de rostos na China é superior ao olho humano. Isso também se deve à transição em larga escala da China do reconhecimento 2D para 3D.

No primeiro caso, os algoritmos usam imagens bidimensionais armazenadas em bancos de dados para análise. O reconhecimento 3D analisa imagens tridimensionais reconstruídas e demonstra uma precisão muito maior. Na China, usando a digitalização de face, você pode fazer compras (por exemplo, pagar pedidos na KFC), efetuar pagamentos e entrar em edifícios.

imagem

No Alipay, você precisa sorrir para que o sistema de reconhecimento de pagamentos entenda: antes não é uma fotografia, mas uma pessoa viva. Alega-se que é impossível enganar Alipay: mudar a cor do cabelo, maquiagem, usar uma peruca não muda nada. O sistema utiliza um conjunto de recursos distintos que levam em conta a geometria da face e a localização de determinados pontos nela.

Conclusões


A escala do investimento direto das empresas ocidentais e da China na tecnologia de reconhecimento de rosto é enorme. No entanto, a implementação de tais projetos na Rússia é uma questão de tempo. Grandes empresas comerciais já entendem os benefícios e benefícios econômicos. Se considerarmos o reconhecimento facial como um produto, é importante entender que cada segmento do negócio tem suas próprias especificidades, incluindo preço. Quanto maior a empresa, mais câmeras e módulos de análise podem ser necessários. As soluções para grandes empresas são sempre projetos personalizados complexos, e a personalização requer fundos adicionais. Empresas de médio e pequeno porte podem fazer facilmente com uma câmera com um módulo de reconhecimento facial conectado. Nesse caso, o custo da solução é comparável ao uso da vigilância por vídeo na nuvem.

Source: https://habr.com/ru/post/pt443906/


All Articles