
La capacité de voir et de reconnaître rapidement les visages est une superpuissance. Pas besoin de passer du temps à analyser, étudier les rides, les plis et les ovales. La reconnaissance faciale est instantanée et sans effort. C’est si facile que nous ne réalisons pas comment nous le faisons.
Réfléchissez à la façon dont les différents visages se ressemblent - deux yeux, une bouche, un nez, des oreilles qui dépassent sur les côtés, à chaque fois dans le même ordre (le plus souvent). Il est incroyable que nous analysions un objet avec une telle facilité.
Nous sommes «programmés» pour reconnaître les visages dès la naissance, mais maintenant les gens ont accompli plus - ils ont enseigné cette compétence à la machine. Comment la mise en œuvre généralisée des systèmes de reconnaissance et d'identification des personnes affectera-t-elle la société?
Pareidolia: recherche automatique de visages

Les personnes en mode "automatique" peuvent distinguer les images familières sur n'importe quelle surface. Seuls trois éléments architecturaux du bâtiment sont perçus comme le visage d'un canard surpris. Ceci est un exemple de pareidolia.
Le mot pareidolia vient des mots grecs para (para - proche, proche, déviation de tout) et eidolon - image. C'est le nom d'une illusion d'optique, la perception d'une image ou d'un sens là où ils ne sont vraiment pas. Par exemple, un visage sur un tronc d'arbre ou des figures animales dans les nuages est une paréidolie.
Plus de ces photos peuvent être trouvées sur thingswithfaces.comLes visages des gens et les visages des animaux que nous voyons dans
n'importe quelle figure géométrique. Toute la culture emoji est construite sur ce principe. :-)

Le phénomène de la paréidolie se traduit facilement dans le langage des algorithmes.
Les artistes de Shinseungback Kimyonghun ont photographié des nuages, fusionnant un instant dans des visages humains, en utilisant un script avec la bibliothèque OpenCV.
Illusion de Thatcher: erreurs biologiques systémiques

Il y a un bug biologique qui montre la
grande importance de la compétence de reconnaissance . La plupart des objets qui vous entourent - une chaise, une table, un ordinateur, sont faciles à voir et à identifier correctement sous n'importe quel angle. Pas des visages.
Le visage inversé provoque un dysfonctionnement du cerveau appelé effet Thatcher (illusion). Le phénomène décrit une condition dans laquelle il est difficile de détecter des changements locaux dans une photo portrait inversée.
Retournez la photo de Margaret Thatcher et regardez le résultat. La première photo semble normale, mais si vous la retournez, la mauvaise position des yeux et de la bouche attire immédiatement le regard. L'homme et un réseau neuronal artificiel perçoivent les images de différentes manières. Il est étonnant que le «réseau de neurones» entre nos oreilles soit si facile à tromper.
L'illusion de Thatcher démontre certains mécanismes de base par lesquels notre cerveau traite les informations. Le cerveau lit un ensemble d'éléments individuels: une paire d'yeux, le nez, la bouche, les oreilles. En plus des caractéristiques individuelles des traits du visage, leur relation entre eux et l'emplacement est prise en compte. Autrement dit, une personne est perçue comme un système complet.
Par conséquent, lorsque l'on nous montre un visage inversé, il est plus difficile pour le cerveau d'évaluer l'image entière - les informations sont "collectées" séparément pour chaque élément: les yeux sont en place, la bouche est comme une bouche. Cependant, dès que l'on nous montre le bon visage, soudain la perception d'un seul système se reconnecte et les problèmes commencent: il devient clair que les caractéristiques familières sont interconnectées de manière inhabituelle.
Pourquoi est-ce important? Le cerveau humain est capable de reconnaître les plus petites différences dans les traits du visage en raison de l'intégrité de la perception. La zone du cortex cérébral reconnaît le visage et détermine la direction du regard, l'amygdale et le lobe des îlots analysent l'expression faciale, et la zone de la zone préfrontale du lobe frontal et du système cérébral, qui est responsable de la sensation de plaisir, évalue sa beauté.
Un bug comme une fonctionnalité: les visages de Chernov

(
c )
La particularité de la perception humaine est utilisée pour analyser des données multidimensionnelles agrégées à l'aide de "visages". En 1973, le mathématicien américain German Chernov a décrit le concept d'utiliser des «personnes» pour identifier les relations caractéristiques et étudier les relations complexes entre plusieurs variables.
Les données de Chernov se reflètent sous la forme de visages-pictogrammes, où les valeurs relatives des variables sélectionnées sont présentées sous la forme et la taille des caractéristiques individuelles: longueur du nez, angle entre les sourcils, largeur du visage - jusqu'à 36 variables au total. Ainsi, l'observateur peut identifier les caractéristiques visuelles des objets qui sont uniques pour chaque configuration de valeurs.
Un rapide coup d'œil au diagramme composé de faces vous permettra de déterminer rapidement si les caractéristiques des profils diffèrent significativement (coïncident). Avec un examen détaillé des caractéristiques faciales, il devient clair dans quelles caractéristiques (chaque caractéristique faciale est une caractéristique distincte de l'ensemble de données d'origine) la similitude et quelle est la différence. Par exemple, dans l'illustration ci-dessus, il est facile de remarquer la différence entre les pays par des émoticônes tristes et drôles.
Pourquoi car ton visage

L'habileté de la reconnaissance faciale rapide aide à ramasser votre enfant à la maternelle, à choisir un partenaire, à exprimer correctement et correctement ses émotions. Mais que se passe-t-il lorsqu'une personne transfère cette capacité à un réseau neuronal artificiel?
Une idée peut provoquer un rejet. Tout le monde n'est pas prêt à accepter facilement une technologie qui stocke des données, surveille les mouvements, analyse les achats et les émotions. Le passage d'une simple vidéosurveillance à une analyse vidéo personnalisée entraîne une augmentation significative des responsabilités.

Aujourd'hui, des algorithmes tels que
DeepFace déterminent les similitudes des individus avec une précision supérieure à celle des humains. L'algorithme Nvidia lui-même crée les visages de personnes inexistantes en quelques secondes. Les visages du collage ci-dessus sont
générés par le réseau de neurones StyleGAN, formé sur un ensemble de données de 70 000 images. Ils ont l'air terriblement réalistes.
Démonstration de l'algorithme SearchFaceAu début, l'algorithme de reconnaissance faciale de Facebook a provoqué une vigilance accrue, mais ensuite tout le monde s'y est habitué (ou a quitté le réseau social). Le service FindFace pour rechercher des personnes sur des photos sur VKontakte a reçu des critiques mitigées et a été utilisé pour l'intimidation, mais la fermeture du projet similaire SearchFace a déjà provoqué une réaction négative des utilisateurs - au final, si les données sont disponibles, alors laissez-les être ouvertes à tout le monde.
Les détaillants installent une technologie de reconnaissance faciale pour prévenir le vol, collectent des données sur l'âge, le sexe et même les émotions des clients. Au final, l'objectif est d'améliorer le service client et d'en tirer parti. Lorsque les clients se rendent compte que le système leur est personnellement avantageux, beaucoup acceptent d'introduire de nouvelles technologies.
Étant donné le nombre croissant de cas de «vol d'identité» - fraude à la carte de crédit et aux données personnelles, les consommateurs préféreront le système au bon moment. les identifie correctement.
Actuellement, les algorithmes aident à résoudre les problèmes de mauvaise illumination du cadre, de faible résolution et de masquage - tels que les lunettes, les perruques et les poils de plusieurs jours. Les systèmes fonctionnent à une vitesse incroyable et mappent une personne à une base de données de millions de personnes en une seconde.
Aux États-Unis, certains magasins
offrent aux suspects de vol le choix: autorisez-vous à prendre une photo ou à obtenir une accusation officielle de crime. Un voleur gagne la liberté avec une interdiction de faire du shopping, et sa photo entre officiellement dans la base de données. Les fichiers contenant des images de personnes sont cryptés et disponibles uniquement pour le propriétaire du système.
Qui profite de la reconnaissance
La plupart des magasins ont déjà installé des caméras de vidéosurveillance. Pour l'analyse vidéo, la mise à jour du matériel n'est pas requise - connectez simplement le service cloud. Et avec le service d'analyse vidéo Ivideon, le seuil d'entrée est pratiquement absent.
Le coût de la solution est de 1700 roubles par caméra, ce qui donne à tout entrepreneur un accès au logiciel.
Le principal motif pour les détaillants d'utiliser la technologie de reconnaissance faciale est d'empêcher le vol. Selon
la National Retail Foundation, aux États-Unis seulement, environ 1,33% de tous les biens en 2017 ont été perdus en raison de vols - pas moins de dommages d'une valeur de 46,8 milliards de dollars.
La technologie de reconnaissance faciale réduit le nombre de vols dans les magasins de plus de 30%.
Souvent, des facteurs secondaires influencent le montant des dommages: négligence des employés, mauvaise préparation du service de sécurité, désir d'économiser. Ces problèmes et d'autres doivent être résolus avec les caméras et la technologie cloud.
Le système de reconnaissance faciale facilite le travail rapide avec les listes noires: il compare la photo du client avec une base de données de personnes non fiables et, s'il correspond, envoie un avertissement approprié aux gardes.
Le logiciel analytique améliore considérablement la sécurité du magasin. Un voleur expérimenté est capable de remarquer les "angles morts" des caméras. Dans ce cas, le gardien peut utiliser son téléphone pour photographier le suspect, puis vérifier si cette personne se trouve dans la base de données.
Les marques utilisent le marketing mobile depuis longtemps - elles envoient des SMS, des notifications push et diffusent des publicités ciblées. Pour la vente au détail traditionnelle, les systèmes de reconnaissance offrent les mêmes capacités que les vendeurs en ligne avec des cookies ont reçus.
La même plate-forme utilisée pour identifier les voleurs aide les vendeurs à déterminer quelles vitrines attirent mieux les clients. Le système de reconnaissance permet d'identifier le client VIP juste à l'entrée du magasin. En utilisant les données du CRM, le vendeur peut rapidement faire à un client une offre avantageuse.
Au Centre financier international de Séoul, des caméras sur des panneaux d'information déterminent en temps réel l' âge et le sexe d'une personne et proposent des publicités en fonction des paramètres identifiésL'information client active un outil puissant pour augmenter les ventes et évaluer les besoins du public. Les caméras vous aideront à configurer l'affichage des publicités vidéo pour un visiteur particulier, en fonction de son sexe, de son âge et de son état émotionnel, ainsi qu'à devenir des fournisseurs de données pour calculer l'efficacité de la publicité.
Les opportunités ci-dessus pour les détaillants sonnent souvent comme un buzz publicitaire ennuyeux. Les thèses sur la «croissance des bénéfices» et les «besoins d'audience» accompagnent tout outil informatique sur le marché - de l'ERP au prix électronique.
Y a-t-il autre chose à faire face aux systèmes de reconnaissance que du marketing pur sur l'intelligence artificielle et les technologies futures? Nous répondrons à cette question par des exemples d'utilisation de systèmes réels dans des magasins existants.
«Travail sur le terrain»: qui en conditions réelles reconnaît les visages

7-Eleven est la plus grande chaîne de vente au détail au monde, Seven-Eleven Japan gérant plus de 36 000 petits magasins dans 18 pays. La société a récemment
installé des logiciels dans 11 000 de ses magasins. La technologie de reconnaissance faciale et d'analyse du comportement dans le réseau de distribution est utilisée pour identifier les détenteurs de cartes de fidélité, surveiller le trafic client, déterminer le niveau des stocks de marchandises dans les entrepôts.

Saks est une chaîne centenaire de magasins haut de gamme qui appartient actuellement à l'une des plus anciennes entreprises au monde (fondée en 1670) par la Compagnie de la Baie d'Hudson. Saks
utilise l' analyse vidéo principalement pour prévenir le vol. Le logiciel compare les photos des suspects de vol à une base de données de voleurs à l'étalage bien connus. Les caméras sont connectées en réseau, de sorte que les résultats peuvent être consultés au siège de Saks à New York.
Selon Guardian, les magasins et les hôtels premium en Europe utilisent régulièrement la technologie de reconnaissance faciale pour suivre les VIP et les célébrités afin de leur offrir les conditions les plus confortables.

Aux États-Unis, le CaliBurger Burger Network
utilise la technologie de reconnaissance faciale dans un programme de fidélité. Le kiosque interactif «reconnaît» les clients, se souvient des commandes et propose des plats préférés, accepte les paiements avec identification par visage.
Le système supprime le seuil d'accès au programme de bonus pour les personnes âgées, qui peuvent avoir du mal à utiliser l'application mobile, les points bonus et les cartes de crédit.Les systèmes de reconnaissance faciale sont largement utilisés en Asie, en particulier en Chine, où ils sont utilisés pour payer de la nourriture, retirer de l'argent à un guichet automatique ou même prendre des prêts. La précision de reconnaissance des visages en Chine est supérieure à l'œil humain. Cela est également dû à la transition à grande échelle de la Chine de la reconnaissance 2D à la reconnaissance 3D.
Dans le premier cas, les algorithmes utilisent des images bidimensionnelles stockées dans des bases de données pour l'analyse. La reconnaissance 3D analyse les images reconstruites en trois dimensions et démontre une précision beaucoup plus élevée. En Chine, à l'aide de scans de visage, vous pouvez effectuer des achats (par exemple, payer des commandes chez KFC), effectuer des paiements et entrer dans des bâtiments.

A Alipay,
il faut sourire pour que le système de reconnaissance des paiements comprenne: avant que ce ne soit pas une photo, mais une personne vivante. On prétend qu'il est impossible de tromper Alipay: changer la couleur des cheveux, le maquillage, utiliser une perruque ne change rien. Le système utilise un ensemble de caractéristiques distinctives qui prennent en compte la géométrie du visage et l'emplacement de certains points sur celui-ci.
Conclusions
L'ampleur des investissements directs des entreprises occidentales et de la Chine dans la technologie de reconnaissance faciale est énorme. Néanmoins, la mise en œuvre de tels projets en Russie est une question de temps. Les grandes entreprises commerciales comprennent déjà les avantages et les avantages économiques. Si nous considérons la reconnaissance faciale comme un produit, il est important de comprendre que chaque segment de l'entreprise a ses propres spécificités, y compris le prix. Plus l'entreprise est grande, plus il faudra de caméras et de modules d'analyse. Les solutions pour les grandes entreprises sont toujours des projets personnalisés complexes et la personnalisation nécessite des fonds supplémentaires. Les moyennes et petites entreprises peuvent facilement faire avec une seule caméra avec un module de reconnaissance faciale connecté. Dans ce cas, le coût de la solution est comparable à l'utilisation de la vidéosurveillance cloud.