Cosechadores de análisis de video: lo que el cerebro y las máquinas hacen con nuestras caras

imagen

La capacidad de ver y reconocer caras rápidamente es una superpotencia. No es necesario pasar tiempo analizando, estudiando arrugas, pliegues y óvalos. El reconocimiento facial es instantáneo y sin esfuerzo. Es tan fácil que no nos damos cuenta de cómo lo hacemos.

Piense en cómo se ven las caras diferentes: dos ojos, una boca, una nariz, orejas sobresalientes a los lados, cada vez en el mismo orden (con mayor frecuencia). Es increíble que analicemos un objeto con tanta facilidad.

Estamos "programados" para reconocer rostros desde el nacimiento, pero ahora las personas han logrado más: le enseñaron esta habilidad a la máquina. ¿Cómo afectará la sociedad la implementación generalizada de los sistemas de reconocimiento e identificación de personas?

Pareidolia: búsqueda automática de rostros


imagen

Las personas en el modo "automático" pueden distinguir entre imágenes familiares en cualquier superficie. Solo tres elementos arquitectónicos del edificio se perciben como la cara de un pato sorprendido. Este es un ejemplo de pareidolia.

La palabra pareidolia proviene de las palabras griegas para (para - cerca, cerca, desviación de cualquier cosa) y eidolon - imagen. Este es el nombre de una ilusión óptica, la percepción de una imagen o significado donde realmente no están. Por ejemplo, una cara en el tronco de un árbol o figuras de animales en las nubes es una pareidolia.

imagen
Más fotos de este tipo se pueden encontrar en thingswithfaces.com

Las caras de las personas y las caras de los animales que vemos en cualquier figura geométrica. Toda la cultura emoji se basa en este principio. :-)

imagen

El fenómeno de pareidolia se traduce fácilmente al lenguaje de los algoritmos. Los artistas de Shinseungback, Kimyonghun, fotografiaron nubes, fusionándose por un momento en rostros humanos, usando un guión con la biblioteca OpenCV.

Ilusión de Thatcher: errores biológicos del sistema


imagen

Hay un error biológico que muestra la gran importancia de la habilidad de reconocimiento . La mayoría de los objetos a su alrededor, una silla, una mesa, una computadora, son fáciles de ver e identificar correctamente desde cualquier ángulo. Simplemente no caras.

La cara invertida da lugar a un mal funcionamiento en el cerebro llamado efecto Thatcher (ilusión). El fenómeno describe una condición en la que es difícil detectar cambios locales en una foto de retrato invertida.

Dale la vuelta a la foto de Margaret Thatcher y mira el resultado.
imagen

La primera foto parece normal, pero si la voltea, la posición incorrecta de los ojos y la boca inmediatamente llama la atención. El hombre y una red neuronal artificial perciben las imágenes de diferentes maneras. Es sorprendente que la "red neuronal" entre nuestros oídos sea tan fácil de engañar.

La ilusión de Thatcher demuestra algunos mecanismos básicos por los cuales nuestro cerebro procesa la información. El cerebro lee un conjunto de elementos individuales: un par de ojos, nariz, boca, oídos. Además de las características individuales de los rasgos faciales, se tiene en cuenta su relación entre ellos y la ubicación. Es decir, una persona se percibe como un sistema completo.

Por lo tanto, cuando se nos muestra una cara invertida, es más difícil para el cerebro evaluar la imagen completa: la información se "recopila" por separado para cada elemento: los ojos están en su lugar, la boca es como una boca. Sin embargo, tan pronto como se nos muestra la cara correcta, de repente la percepción de un solo sistema se reconecta y comienzan los problemas: queda claro que las características familiares están interconectadas de una manera inusual.

¿Por qué es esto importante? El cerebro humano es capaz de reconocer las diferencias más pequeñas en las características faciales debido a la integridad de la percepción. El área de la corteza cerebral reconoce la cara y determina la dirección de la mirada, la amígdala y el lóbulo de los islotes analizan la expresión facial, y el área en el área prefrontal del lóbulo frontal y el sistema cerebral responsables de la sensación de placer evalúan su belleza.

Un error como una característica: las caras de Chernov


imagen
( c )

La peculiaridad de la percepción humana se utiliza para analizar datos multidimensionales agregados utilizando "caras". En 1973, el matemático estadounidense German Chernov describió el concepto de usar "personas" para identificar relaciones características y estudiar relaciones complejas entre varias variables.

Los datos de Chernov se reflejan en forma de caras-pictogramas, donde los valores relativos de las variables seleccionadas se presentan como las formas y tamaños de las características individuales: longitud de la nariz, ángulo entre las cejas, ancho de la cara: hasta 36 variables en total. Por lo tanto, el observador puede identificar características visuales de los objetos que son únicos para cada configuración de valores.

Un vistazo rápido al diagrama compuesto por caras le permitirá determinar rápidamente si las características de los perfiles difieren significativamente (coinciden). Con una revisión detallada de las características faciales, queda claro en qué características (cada característica facial es una característica separada del conjunto de datos original) la similitud y cuál es la diferencia. Por ejemplo, en la ilustración de arriba, es fácil notar la diferencia entre países con emoticones tristes y divertidos.

¿Por qué cuidar tu cara?


imagen

La habilidad del reconocimiento rápido de la cara ayuda a recoger a su hijo del jardín de infantes, elegir un compañero, expresar las emociones correcta y adecuadamente. Pero, ¿qué sucede cuando una persona transfiere esta capacidad a una red neuronal artificial?

Una idea puede causar rechazo. No todos están listos para aceptar fácilmente la tecnología que almacena datos, monitorea el movimiento, analiza las compras y las emociones. La transición de la videovigilancia simple a la analítica de video personalizada implica un aumento significativo de la responsabilidad.

imagen

Hoy, algoritmos como DeepFace determinan las similitudes de los individuos con una precisión más alta que la de los humanos. El algoritmo de Nvidia crea las caras de personas inexistentes en pocos segundos. Las caras en el collage de arriba son generadas por la red neuronal StyleGAN, entrenada en un conjunto de datos de 70,000 imágenes. Se ven terriblemente realistas.

imagen
Demostración del algoritmo SearchFace

Al principio, el algoritmo de reconocimiento facial de Facebook causó una mayor alerta, pero luego todos se acostumbraron (o abandonaron la red social). El servicio FindFace para buscar personas en fotos en VKontakte recibió críticas mixtas y se utilizó para el acoso escolar, pero el cierre del proyecto similar SearchFace ya causó una reacción negativa de los usuarios: al final, si los datos están disponibles, que estén disponibles para todos.

Los minoristas instalan tecnología de reconocimiento facial para evitar robos, recopilar datos sobre la edad, el sexo e incluso las emociones de los clientes. Al final, el objetivo es mejorar el servicio al cliente y capitalizarlo. Cuando los clientes se den cuenta de que el sistema les beneficia personalmente, muchos aceptarán introducir nuevas tecnologías.

Dado el creciente número de casos de "robo de identidad" - fraude de tarjetas de crédito y datos personales, los consumidores preferirán el sistema en el momento adecuado. los identifica correctamente

Actualmente, los algoritmos ayudan a resolver los problemas de poca iluminación del marco, baja resolución y enmascaramiento, como anteojos, pelucas y cerdas de varios días. Los sistemas funcionan a una velocidad tremenda y asignan a una persona a una base de datos de millones de personas en solo un segundo.

Algunas tiendas en los Estados Unidos ofrecen una opción a los sospechosos de robo: permítete tomar una foto u obtener un cargo por delito formal. Un ladrón gana libertad junto con la prohibición de comprar, y su foto ingresa oficialmente en la base de datos. Los archivos que contienen imágenes de personas están encriptados y disponibles solo para el propietario del sistema.

¿Quién se beneficia del reconocimiento?



La mayoría de las tiendas ya han instalado cámaras de CCTV. Para el análisis de video, no se requiere actualización de hardware, solo conecte el servicio en la nube. Y con el servicio de análisis de video Ivideon, el umbral de entrada está prácticamente ausente. El costo de la solución es de 1.700 rublos por cámara, lo que le da a cualquier empresario acceso al software.

El motivo principal para que los minoristas utilicen la tecnología de reconocimiento facial es evitar el robo. Según la National Retail Foundation, solo los Estados Unidos, aproximadamente el 1.33% de todos los bienes en 2017 se perdieron debido al robo, no menos daños por un valor de $ 46.8 mil millones.

La tecnología de reconocimiento facial reduce el número de robos en tiendas en más del 30%.

A menudo, los factores secundarios influyen en la cantidad de daños: negligencia de los empleados, preparación deficiente del servicio de seguridad, deseo de ahorrar. Estos y otros problemas deben resolverse con cámaras y tecnología en la nube.

El sistema de reconocimiento facial facilita el trabajo rápido con listas negras: compara la foto del cliente con una base de datos de personas poco confiables y, si coincide, envía una advertencia apropiada a los guardias.

El software analítico mejora en gran medida la seguridad de la tienda. Un ladrón experimentado puede notar los "puntos ciegos" de las cámaras. En este caso, el guardia puede usar su teléfono para fotografiar al sospechoso y luego verificar si esta persona está en la base de datos.

Las marcas han estado utilizando el marketing móvil durante mucho tiempo: envían SMS, envían notificaciones y muestran anuncios dirigidos. Para el comercio minorista tradicional, los sistemas de reconocimiento ofrecen las mismas capacidades que los vendedores en línea con cookies han recibido.

La misma plataforma que se utiliza para identificar a los ladrones ayuda a los vendedores a descubrir qué escaparates atraen mejor a los clientes. El sistema de reconocimiento ayuda a identificar al cliente VIP justo en la entrada de la tienda. Usando los datos de CRM, el vendedor puede hacer rápidamente a un cliente una oferta ventajosa.

imagen
En el Centro Financiero Internacional de Seúl, las cámaras en paneles de información en tiempo real determinan la edad y el sexo de una persona y ofrecen publicidad de acuerdo con los parámetros identificados

La información del cliente activa una herramienta poderosa para aumentar las ventas y evaluar las necesidades de la audiencia. Las cámaras lo ayudarán a configurar la visualización de anuncios de video para un visitante en particular, dependiendo de su sexo, edad y estado emocional, así como a convertirse en proveedores de datos para calcular la efectividad de la publicidad.

Las oportunidades anteriores para los minoristas a menudo suenan como un zumbido publicitario molesto. Las tesis sobre "crecimiento de ganancias" y "necesidades de audiencia" acompañan cualquier herramienta de TI en el mercado, desde ERP hasta un precio electrónico. ¿Hay algo más para enfrentar los sistemas de reconocimiento que el marketing puro sobre inteligencia artificial y tecnologías futuras? Responderemos esta pregunta a través de ejemplos de uso de sistemas reales en tiendas existentes.

"Trabajo en el campo": quien en condiciones reales reconoce caras


imagen

7-Eleven es la cadena minorista más grande del mundo, con Seven-Eleven Japan administrando más de 36,000 pequeñas tiendas en 18 países. La compañía instaló recientemente software en 11,000 de sus tiendas. La tecnología de reconocimiento de rostros y análisis de comportamiento en la red de distribución se utiliza para identificar a los titulares de tarjetas de fidelización, monitorear el tráfico de clientes y determinar el nivel de existencias de bienes en los almacenes.

imagen

Saks es una cadena centenaria de tiendas premium que actualmente es propiedad de una de las compañías más antiguas del mundo (fundada en 1670) por Hudson's Bay Company. Saks utiliza análisis de video principalmente para evitar robos. El software verifica fotos de sospechosos de robo contra una base de datos de ladrones conocidos. Las cámaras están conectadas en red, por lo que los resultados se pueden ver en la sede de Saks en Nueva York.

Según Guardian, las tiendas y hoteles premium en Europa utilizan regularmente tecnología de reconocimiento facial para rastrear a VIP y celebridades para brindarles las condiciones más cómodas.

imagen

En los EE. UU., CaliBurger Burger Network utiliza tecnología de reconocimiento facial en un programa de fidelización. El quiosco interactivo "reconoce" a los clientes, recuerda los pedidos y ofrece platos favoritos, acepta pagos con identificación por la cara.

El sistema elimina el umbral para ingresar al programa de bonificación para las personas mayores, que pueden tener dificultades para usar la aplicación móvil, los puntos de bonificación y las tarjetas de crédito.

Los sistemas de reconocimiento facial se usan ampliamente en Asia, especialmente en China, donde se usan para pagar alimentos, retirar efectivo de un cajero automático o incluso pedir préstamos. La precisión del reconocimiento facial en China es superior al ojo humano. Esto también se debe a la transición a gran escala de China del reconocimiento 2D a 3D.

En el primer caso, los algoritmos utilizan imágenes bidimensionales almacenadas en bases de datos para su análisis. El reconocimiento 3D analiza imágenes tridimensionales reconstruidas y demuestra una precisión mucho mayor. En China, mediante escaneos faciales, puede realizar compras (por ejemplo, pagar pedidos en KFC), realizar pagos e ingresar a edificios.

imagen

En Alipay, debe sonreír para que el sistema de reconocimiento de pagos comprenda: antes no es una fotografía, sino una persona viva. Se alega que es imposible engañar a Alipay: cambiar el color del cabello, el maquillaje, usar una peluca no cambia nada. El sistema utiliza un conjunto de características distintivas que tienen en cuenta la geometría de la cara y la ubicación de ciertos puntos en ella.

Conclusiones


La escala de inversión directa de las empresas occidentales y China en tecnología de reconocimiento facial es enorme. Sin embargo, la implementación de tales proyectos en Rusia es cuestión de tiempo. Las grandes empresas comerciales ya entienden los beneficios y beneficios económicos. Si consideramos el reconocimiento facial como un producto, es importante comprender que cada segmento del negocio tiene sus propios detalles, incluido el precio. Cuanto más grande sea la empresa, más cámaras y módulos de análisis pueden ser necesarios. Las soluciones para grandes empresas son siempre proyectos complejos y personalizados, y la personalización requiere fondos adicionales. Las empresas medianas y pequeñas pueden hacerlo fácilmente con una cámara con un módulo de reconocimiento facial conectado. En este caso, el costo de la solución es comparable al uso de videovigilancia en la nube.

Source: https://habr.com/ru/post/443906/


All Articles