Les 5 principaux domaines d'application des systèmes de reconnaissance d'objets



Les tentatives pour enseigner à divers systèmes de voir et de comprendre le monde comme une personne ont commencé il y a plusieurs décennies, mais maintenant ces technologies sont devenues si parfaites qu'elles sont activement utilisées dans de nombreux domaines de notre vie. Habré a déjà des articles détaillés sur la vision industrielle, les réseaux de neurones et les algorithmes de reconnaissance, donc nous n'allons pas approfondir et décrire à nouveau ces technologies complexes, nous parlerons de l'utilisation pratique de ces systèmes dans le monde réel.

Comment ça marche? Brièvement


La photographie pour nous, pour un système de reconnaissance d'image, n'est qu'un ensemble de pixels avec différents paramètres de couleur. Pour apprendre au système à reconnaître des objets individuels dans une image, vous devez lui fournir un ensemble de données - un ensemble de milliers d'images qui indiquent exactement où se trouve l'objet souhaité. Par exemple, si nous voulons que le système apprenne à reconnaître les gens dans les images, nous devons lui montrer beaucoup de photos de personnes d'âges différents, dans des poses et des vêtements différents, dans des conditions différentes. Après une telle formation, le système pourra reconnaître avec précision la personne sur les photos. Cependant, une autre question se pose: si pour un système une photographie n'est qu'une collection de pixels, comment un réseau de neurones comprend-il exactement ce qui est représenté sur une photo?

Diverses méthodes sont utilisées pour reconnaître les objets dans l'image, mais l'une des méthodes les plus prometteuses est la méthode de l'histogramme à gradient orienté (HOG). L'image est décolorée, puis en blocs de 16x16 pixels, le système trouve la direction du changement de couleur (vecteur de dégradé), construit une carte de ces vecteurs sur toute l'image, et ainsi «capture» les signes de l'objet, qui ne changent pas en fonction de la position / position et de l'éclairage. Une version améliorée de l'algorithme est appelée CoHOG - elle prend en compte les limites des objets, c'est-à-dire qu'elle reconnaît la forme, et pas seulement les vecteurs de gradient.

Toshiba a amélioré la méthode CoHOG, améliorant considérablement la reconnaissance en basse lumière - le CoHOG traditionnel, par exemple, fait mal avec une reconnaissance rapide dans l'obscurité, lorsque les piétons sont à peine visibles dans les phares. La méthode ECoHOG (technologie des histogrammes de la présence combinée de gradients orientés) détermine une personne à travers une analyse supplémentaire des directions et des tailles de ses contours, trouvant sa tête, ses jambes, ses bras, ses épaules. Si CoHOG isole simplement les contours anthropométriques de l'image (analyse «frontière d'objet - vecteurs de frontière»), alors pour ECoHOG les dimensions des frontières d'objet les unes par rapport aux autres sont importantes.

Cinq domaines d'application clés


Le marketing


La reconnaissance des formes est un domaine prometteur dans la publicité et le marketing. Les réseaux de neurones sont autorisés à apprendre des choses en quelques heures, ce qui dans d'autres cas nécessite une grande équipe de professionnels et des semaines, voire des mois de recherche, à trouver. Par exemple, le service russe YouScan, un système de surveillance des médias sociaux, suit la mention des marques sur les réseaux sociaux. De plus, il le fait non seulement dans le texte des articles, mais aussi dans les photographies, et aide également à tirer certaines conclusions sur le produit. Avec l'aide de la reconnaissance des formes, un motif intéressant a été trouvé sur la photo, dont la recherche n'aurait jamais eu lieu pour personne: parmi les animaux, les chats sont plus souvent trouvés avec la technologie Apple, et les chiens avec la marque Adidas. Ces informations inhabituelles peuvent être utiles pour le ciblage publicitaire.


Lors de la recherche du logo Adidas, le service YouScan a filtré les photos avec les smartphones entre les mains des propriétaires. Droit d'auteur: YouScan

Vidéosurveillance


La reconnaissance des formes sur les caméras de surveillance urbaine est peut-être la perspective la plus inévitable d'utiliser la vision industrielle. Depuis 2017, un système de vidéosurveillance intelligent a été testé à Moscou afin d'identifier les criminels dans les endroits surpeuplés. La technologie de la société russe NTechLab, qui a déjà aidé à détenir plusieurs dizaines de délinquants, est connectée au réseau de caméras de la ville. En Chine, un tel système de vidéosurveillance est capable de reconnaître non seulement les visages, mais aussi les marques de voitures et de vêtements en public, qui peuvent ensuite être utilisées par les commerçants pour leurs recherches.

La vidéo montre le vrai travail de reconnaissance des images et des visages SenseTime

Médecine


La reconnaissance des formes est déjà devenue une véritable percée en médecine - dans de nombreux cas, les ordinateurs remarquent des choses que même les médecins les plus expérimentés manquent. Ils agissent comme des assistants particuliers, dont l’avis «technique» confirme l’hypothèse du médecin ou donne lieu à des recherches plus approfondies.

En Russie, le développement de systèmes logiciels pour le diagnostic des cancers sur les images CT, IRM et TEP est en cours. Pour ce faire, des milliers d'images étiquetées sont conduites à travers le réseau neuronal, après quoi la précision de reconnaissance des nouvelles images augmente à 95-97%. Entre autres, le développement d'une telle plateforme est réalisé par le Département des technologies de l'information de Moscou, à l'aide de la bibliothèque ouverte Google TensorFlow.

Un réseau neuronal Inception créé par Google analyse un examen microscopique d'une biopsie des ganglions lymphatiques à la recherche de cellules cancéreuses dans les glandes mammaires. Pour une personne, il s'agit d'un processus très long et laborieux, au cours duquel il est facile de faire une erreur ou de manquer quelque chose d'important, car dans certains cas, la taille de l'image est de 100 000 x 100 000 pixels. Le réseau neuronal Inception offre une sensibilité d'environ 92% contre 72% chez le médecin. Le réseau neuronal ne perdra pas de vue toutes les zones suspectes d'images, bien que de fausses alarmes soient autorisées, que le médecin filtrera plus tard.

Les voitures


La reconnaissance d'objets dans les voitures est un élément nécessaire des systèmes de sécurité ADAS (Advanced Driver-Assistance Systems). ADAS peut être mis en œuvre avec des outils sophistiqués, tels que des capteurs radar et infrarouges, ou avec une caméra monoculaire. Dans un précédent article, nous avions déjà dit qu'une caméra vidéo suffisait pour qu'une voiture reconnaisse en temps réel les piétons, les panneaux et les feux de circulation. Cependant, une telle reconnaissance "à la volée" est une tâche très gourmande en ressources, qui nécessite un processeur spécialisé. Toshiba développe une série de processeurs depuis plusieurs années. Ils construisent un modèle en trois dimensions basé sur une image en mouvement à partir d'une seule caméra et remarquent ainsi des obstacles inconnus sur la route. En effet, si un réseau neuronal est formé pour reconnaître uniquement les personnes, les marques et les signes, alors un pneu ou un morceau de clôture posé sur l'asphalte ne sera pas reconnu et considéré comme un danger.


Les processeurs Visconti identifient les zones dans l'image, les classent et aident le pilote automatique ou l'ADAS à prendre une décision. Source: Toshiba

Drones


Dans les drones, la reconnaissance d'objets est utilisée à la fois pour le divertissement et à des fins scientifiques. En 2015, le drone Lily a fait beaucoup de bruit avec le démarrage automatique du moteur lors de la fonction de lancer et de suivi pour le propriétaire. Lily dirigea l'objectif vers le propriétaire, quelles que soient la trajectoire et la vitesse de son mouvement. Certes, cette fonction de Lily n'avait rien à voir avec la reconnaissance des formes, car le drone regardait non seulement l'image d'une personne, mais le panneau de commande, qui était placé sur la main du propriétaire.


Les drones de reconnaissance d'image sont également utilisés pour des choses plus sérieuses. Par exemple, la société norvégienne eSmart Systems a développé des solutions de réseaux intelligents. Dans l'un de leurs projets, Connected Drone, les drones sont utilisés pour dépanner les lignes électriques. Formés à la reconnaissance des éléments du réseau électrique, ils vérifient l'intégrité des fils, isolateurs et autres parties des lignes électriques. Ceci est particulièrement important pour localiser rapidement un dysfonctionnement lorsque l'alimentation électrique d'une ville ou d'une entreprise dépend de la ligne. Étant donné que les lignes électriques sont souvent construites dans des endroits difficiles d'accès, l'envoi d'une équipe de drones pour trouver un dysfonctionnement quelque part dans la taïga ou dans les montagnes est beaucoup plus efficace que d'envoyer une équipe de personnes.


Les drones ESmart retrouvent des éléments de l'infrastructure énergétique et, en cas de dommage, marquent l'objet, laissant un avertissement à l'opérateur. Source: eSmart Systems

Source: https://habr.com/ru/post/fr433544/


All Articles