La société taïwanaise 42Ark et un fabricant américain de mangeoires CatFi Box «intelligentes» utilisent des caméras de vidéosurveillance pour reconnaître les visages des chatsEn 1941, l'ingénieur électricien allemand Walter Bruch a installé un système de vidéosurveillance (télévision en circuit fermé - un système de télévision en circuit fermé) sur le site d'essai où les fusées V-2 ont été testées. Il s'agit du premier cas dans l'histoire de l'utilisation de la vidéosurveillance dans la pratique. L'opératrice devait rester assise devant le moniteur tout le temps. Cela a continué jusqu'en 1951, jusqu'à l'apparition des premiers appareils VTR (VideoTape Recorder) qui enregistraient des images sur bande magnétique.
L'enregistrement sur les supports n'a pas épargné à l'opérateur la nécessité de participer au processus. Reconnaissance faciale, localisation d'objets, même détection de mouvement - toutes ces fonctions ont été réalisées par une personne assise devant le moniteur en temps réel ou étudiant les archives vidéo après coup.
La roue du progrès roule. La vidéosurveillance a reçu une analyse vidéo qui a complètement changé le processus de travail avec le système. Vous vous souvenez de l'
histoire du chat et du réseau neuronal d'apprentissage en profondeur? Oui, cela fait également partie de l'analyse vidéo, mais minuscule. Aujourd'hui, nous parlerons de technologies qui changent fondamentalement le monde des systèmes de vidéosurveillance.
Détection de file d'attente et test bêta
La première caméra IP au monde Neteye 200, créée en 1996 par AxisLa vidéosurveillance est née comme un système de sécurité fermé, conçu uniquement pour résoudre les problèmes de sécurité. Les limites de la vidéosurveillance analogique ne permettaient pas l'utilisation de l'équipement d'une autre manière. L'intégration de la vidéosurveillance aux systèmes numériques a ouvert la possibilité de recevoir automatiquement diverses données en analysant la séquence d'images.
L'importance est difficile à surestimer: dans le cas habituel, après 12 minutes d'observation continue, l'opérateur commence à manquer jusqu'à 45% des événements. Et jusqu'à 95% des événements potentiellement dérangeants seront manqués après 22 minutes de surveillance continue (selon IMS Research, 2002).
Des algorithmes d'analyse vidéo complexes sont apparus: comptage des visiteurs, comptage des conversions, statistiques des transactions en espèces et bien plus encore. L'opérateur d'observation disparaît dans ce système - nous laissons à l'ordinateur la possibilité de «regarder» et de tirer des conclusions.
L'exemple le plus simple de vidéosurveillance intelligente est la détection de mouvement. Il n'est pas si important qu'il y ait un détecteur intégré dans la caméra elle-même - si vous installez, par exemple, le logiciel
Ivideon Server sur un ordinateur, alors le détecteur de mouvement sera utilisé comme logiciel. Un détecteur peut remplacer plusieurs opérateurs de vidéosurveillance à la fois. Et déjà dans les années 2000, les premiers systèmes d'analyse vidéo capables de reconnaître des objets et des événements dans l'image ont commencé à apparaître.
Ivideon développe actuellement plusieurs modules d'analyse vidéo - depuis la
sortie d'OpenAPI , les choses sont allées plus vite grâce à l'intégration avec des partenaires. Certains projets sont encore en phase de test fermé, mais quelque chose est déjà prêt. Il s'agit, tout d'abord, de l'
intégration avec les caisses enregistreuses pour contrôler les transactions en espèces (basées jusqu'à présent sur iiko et Shtrikh-M). Deuxièmement, un détecteur de file d'attente a été développé.
Nous avions un
comptoir Ivideon , qui déterminait le nombre de clients dans la chambre. L'analytique nous a permis de passer d'un équipement spécial au cloud computing. Maintenant, nous n'avons plus besoin d'une caméra spécifique - toute caméra de surveillance avec une résolution de 1080p + convient. Maintenant, nous voulons non seulement compter les personnes, mais aussi déterminer les files d'attente. Par conséquent, ils sont prêts à tout magasin, centre commercial ou bureau où les gens vont se tenir debout, formant des files d'attente, pour fournir une caméra gratuite pour le test de détection de file d'attente.
Envoyez-nous un e-mail pour participer au projet.
De plus, Ivideon fonctionne avec la technologie de reconnaissance faciale.
Qui reconnaît comment
La technologie DeepFace est testée par Facebook sur l'exemple de la reconnaissance du visage émotionnel de Sylvester StalloneApple, Facebook, Google, Intel, Microsoft et d'autres géants de la technologie travaillent sur des solutions dans ce domaine. Des systèmes de vidéosurveillance avec reconnaissance automatique du visage des passagers sont installés dans 22 aéroports américains. En Australie, ils développent un système de reconnaissance biométrique du visage et des empreintes digitales dans le cadre d'un programme conçu pour automatiser le contrôle des passeports et des douanes.

La plus grande société Internet chinoise Baidu a mené une expérience réussie sur l'annulation de billets en utilisant la technologie de reconnaissance faciale avec une précision de 99,77%, avec un temps de prise de vue et de reconnaissance de 0,6 seconde. Aux entrées du parc, des stands avec des tablettes et des cadres spéciaux sont installés pour effectuer le tournage. Lorsqu'un touriste vient au parc pour la première fois, le système le prend en photo afin d'utiliser la fonction de reconnaissance faciale de la photo à l'avenir. Les nouvelles photos sont comparées aux photos de la base de données - de cette façon, le système détermine si une personne a le droit de visiter.

En Chine, la technologie est généralement très bonne. En 2015, Alipay, un opérateur de plateforme de paiement en ligne, appartenant à Alibaba Holding, a lancé un système de vérification des paiements basé sur Face ++, une plateforme de reconnaissance faciale basée sur le cloud créée par la startup chinoise Megvii. Le système s'appelle Smile to Pay - il permet aux utilisateurs d'Alipay de payer leurs achats en ligne en prenant un selfie (Alipay détermine le propriétaire par le sourire). UBER en Chine a commencé à
utiliser le système de reconnaissance des conducteurs basé sur Face ++ pour lutter contre la fraude, le vol d'identité et offrir une sécurité supplémentaire aux passagers.
Mais il est plus intéressant de regarder non pas les solutions étrangères, mais les services créés en Russie. Ces technologies sont beaucoup plus proches de l'utilisateur final (s'il est de notre pays), vous pouvez vous familiariser avec elles, à l'avenir, unissez-vous pour une utilisation dans votre propre produit. Il existe de nombreuses entreprises de reconnaissance faciale. Rappelons-en quelques-uns qui restent à l'oreille.

La société Vokord, fondée en 1999, utilise FaceControl 3D pour travailler avec des images synchrones de caméras stéréo, construit un modèle 3D du visage dans le cadre et recherche automatiquement le modèle obtenu avec les modèles dans la base de données existante. En 2016, Vokord a
commencé à utiliser son propre algorithme mathématique de reconnaissance faciale, qui est basé sur des réseaux de neurones convolutifs, de sorte que leurs algorithmes fonctionnent désormais avec n'importe quelle caméra de vidéosurveillance. La société affirme qu'elle peut reconnaître les visages (de la taille de 128x128 pixels) des personnes qui suivent le flux. Fin 2016, l'algorithme Vocord DeepVo1 a montré les meilleurs résultats du test d'identification global,
reconnaissant correctement 75,127% des individus.

Fondé en 2012, VisionLabs a remporté le plus grand
concours GoTech d' entreprises technologiques en Russie et en Europe de l'Est, et a été inclus dans la liste des finalistes du programme européen «
Challenge UP! », Conçu pour accélérer le lancement sur le marché de solutions et de services basés sur le concept de l'Internet des objets, a attiré plusieurs millions d'investissements et introduit déjà ses produits dans le secteur commercial. Récemment, Otkritie Bank a lancé le système de reconnaissance faciale VisionLabs pour optimiser le service client et les temps d'attente en ligne. Eh bien, cela vaut la peine de lire une merveilleuse histoire sur la façon dont les spécialistes du CROC ont
attrapé un chat en utilisant VisionLabs.
VisionLabs, qui a montré l'un des meilleurs résultats en termes de taux de reconnaissance et d'erreur, fonctionne également avec des réseaux de neurones qui révèlent des caractéristiques spécifiques de chaque visage, telles que la forme des yeux, la forme du nez, le soulagement des oreillettes, etc. Leur système Luna vous permet de retrouver toutes ces caractéristiques du visage sur la photo dans les archives. Une autre décision de la société, Face Is, reconnaissant le visage du client dans le magasin, trouve son profil dans le système CRM, en apprend l'historique des achats et les intérêts de l'acheteur, et envoie une notification avec une offre personnelle par téléphone pour recevoir une remise sur sa catégorie de produits préférée.
L'automatisation du processus d'embauche pour la startup Skillaz et VisionLabs prévoit d'
introduire fin 2017 un système de reconnaissance informatique qui évaluera le comportement des demandeurs d'emploi. Après avoir analysé les données, le système tirera des conclusions sur les qualités professionnelles d'une personne et sa pertinence pour le poste. Les caractéristiques complètes du système de «location de voitures» ne sont pas divulguées par l'entreprise. On sait seulement que la sociabilité du candidat sera évaluée sur la base de ses réponses à un ensemble spécifique de questions posées par le système d’entretien en ligne. Le réseau neuronal recherchera la relation entre le comportement du candidat dans l'image de la caméra de surveillance et le degré de gravité de l'une ou l'autre compétence.
La grille, qui est le Dr Lightman et Sherlock Holmes en une seule personne, prendra en compte les expressions faciales du candidat, ses gestes, ainsi que la physionomie. Il convient de noter que la méthode de détermination du type de personnalité d'une personne, de ses qualités spirituelles, basée sur l'analyse des caractéristiques externes et de son expression, est considérée comme un exemple moderne de pseudoscience dans la science psychologique moderne. Comment faire face à cette contradiction dans le nouveau produit n'est pas encore clair.
Diapositive de présentation NTechLab déprimant Salman RadaevNTechLab a commencé avec une application qui a déterminé la race de chiens à partir d'une photographie. Plus tard, ils ont écrit l'algorithme FaceN, avec lequel ils ont participé à l'automne 2015 au concours international
The MegaFace Benchmark . NTechLab a remporté deux des quatre nominations, battant l'équipe de Google (dans un an, Vokord gagnera dans le même concours et NTechLab passera en 4e position). Le succès leur a permis de mettre en œuvre rapidement le service
FindFace , à la recherche de personnes à partir de photos sur VKontakte. Mais ce n'est pas le seul moyen d'appliquer la technologie. Au festival Alfa Future People, organisé par Alfa Bank, avec FindFace, les visiteurs ont pu retrouver leurs photos parmi des centaines d'autres en envoyant un selfie à un chatbot.
De plus, NTechLab a
montré un système capable de reconnaître en temps réel le sexe, l'âge et les émotions en utilisant une image provenant d'une caméra vidéo. Le système est capable d'évaluer la réaction du public en temps réel, afin que vous puissiez déterminer les émotions que les visiteurs ressentent lors des présentations ou des diffusions de messages publicitaires. Tous les projets NTechLab sont construits sur des réseaux de neurones auto-apprenants.
Ivideon's Way to Video Analytics
La reconnaissance faciale est l'une des tâches les plus difficiles dans le domaine de l'analyse vidéo. D'une part, tout semble clair et est utilisé depuis longtemps. D'un autre côté, les solutions d'identification dans une foule de personnes sont encore très coûteuses et n'offrent pas une précision absolue.
En 2012, Ivideon a commencé à travailler avec des algorithmes d'analyse vidéo. Cette année-là, nous avons lancé des applications pour iOS et Android, pénétré des marchés étrangers, lancé des réseaux CDN décentralisés avec des serveurs aux États-Unis, aux Pays-Bas, en Allemagne, en Corée, en Russie, en Ukraine, au Kazakhstan et sommes devenus le seul service de vidéosurveillance international qui fonctionne aussi bien dans le monde. En général, il semblait que faire vos analyses avec le blackjack et la reconnaissance serait simple et rapide ... nous étions jeunes, l'herbe semblait plus verte et l'air doux et langoureux.
[
A cette époque, nous envisagions des algorithmes classiques. Vous devez d'abord détecter et localiser les visages dans l'image: utilisez les cascades de Haar , recherchez des régions avec une texture similaire à la peau, etc. Supposons que nous ayons besoin de trouver la première personne qui rencontre et de l'accompagner uniquement dans le flux vidéo. Ici, vous pouvez utiliser l'algorithme Lucas-Canada . Nous trouvons le visage par l'algorithme, puis déterminons les points caractéristiques qu'il contient. Nous accompagnons les points en utilisant l'algorithme Lucas-Canada; après leur disparition, nous pensons que le visage a disparu de la vue. Après avoir reçu les traits caractéristiques du visage, nous pouvons le comparer avec les traits intégrés dans la base de données.
Pour lisser la trajectoire de l'objet (visage), ainsi que pour prédire sa position dans l'image suivante, nous utilisons le filtre de Kalman . Il convient de noter ici que le filtre de Kalman est conçu pour les modèles de mouvement linéaire. Pour les non linéaires, l'algorithme de filtre à particules est utilisé (comme variante de l'algorithme Filtre à particules + décalage moyen ).
Vous pouvez également utiliser des algorithmes de soustraction d'arrière-plan: une bibliothèque avec des exemples de mise en œuvre d'algorithmes pour soustraire l'arrière-plan + un article sur la mise en œuvre de l'algorithme de soustraction d'arrière-plan léger de ViBe. De plus, n'oubliez pas l'une des méthodes Viola-Jones les plus courantes implémentées dans la bibliothèque de vision par ordinateur OpenCV. ]
La simple reconnaissance faciale est bonne, mais pas suffisante. Il est également nécessaire d'assurer un suivi stable de plusieurs objets dans le cadre, même en cas d'intersection conjointe ou de «disparition» temporaire d'un obstacle. Comptez n'importe quel nombre d'objets traversant une certaine zone et tenez compte des directions d'intersection. Pour savoir quand un objet / objet dans le cadre apparaît et disparaît - déplacez la souris sur la tasse sale sur la table et trouvez le moment dans l'archive vidéo où il est apparu et qui l'a quitté. Dans le processus de suivi, un objet peut changer assez fortement (en termes de transformations). Mais de cadre en cadre, ces changements seront tels qu'il sera possible d'identifier l'objet.
De plus, nous voulions mettre une solution cloud universelle à la disposition de tous - des utilisateurs les plus exigeants. La solution devait être flexible et évolutive, car nous-mêmes ne pouvions pas savoir ce que l'utilisateur voulait surveiller et ce que l'utilisateur voulait considérer. Il est tout à fait possible que quelqu'un ait suggéré de faire une émission de cafards basée sur Ivideon avec détermination automatique du vainqueur.
Seulement cinq ans plus tard, nous avons commencé à tester des composants individuels de l'analyse vidéo - nous parlerons plus en détail de ces projets dans de nouveaux articles.
PS Donc, nous recherchons des volontaires pour des tests de détection de file d'attente. Ainsi que les utilisateurs du système SHTRIH-M pour tester un nouveau système de gestion de trésorerie. Écrivez dans l'e-
mail ou dans les commentaires.