Les voitures Google reconnaîtront les piétons avec une grande précision



Avant l'avènement des véhicules sans pilote en vente, il ne reste plus beaucoup de temps. Google évoque la technologie de la vision industrielle et l'un des éléments les plus importants - la reconnaissance des piétons en temps réel.

Les chercheurs de Google Research Alex Krizhevsky, Anelia Angelova et leurs collègues ont présenté une nouvelle méthode de détection des piétons à l'aide de réseaux de neurones . La méthode a montré un résultat encourageant: un piéton peut être détecté avec une grande précision dans 73,8% des cas par le test Caltech Pedestrian, qui contient une base de données de 50000 piétons marqués dans des conditions urbaines et rurales. Ce résultat est comparable aux meilleures conceptions alternatives.

Les experts disent que l'un des domaines prometteurs de ces dernières années a été l' utilisation d'accélérateurs GPU dans les réseaux de neurones pour exécuter des algorithmes complexes presque en temps réel pour la reconnaissance des formes, la PNL et l'analyse fluide du flux vidéo.

Lors de la récente conférence sur la technologie Nvidia GPU, plusieurs de ces solutions ont été introduites . Les progrès technologiques dans ce domaine sont mieux visibles dans le test du défi de reconnaissance visuelle à grande échelle ImageNet , qui a lieu depuis 2010. Depuis lors, le niveau d'erreurs dans la classification des images par les algorithmes de vision industrielle a considérablement diminué.



La reconnaissance des piétons est l'une des tâches pratiques où la nouvelle technologie est utilisée. À l'avenir, les réseaux de neurones avec accélération GPU seront probablement utilisés dans les caméras de surveillance, les systèmes de contrôle de la circulation des véhicules, etc.

Revenant au développement de Google, la reconnaissance des piétons est une tâche très difficile, car elle doit être résolue dans des conditions environnementales en constante évolution en temps quasi réel. Les objets autour de la voiture sont en mouvement. Les technologies existantes résolvent relativement bien ce problème. Par exemple, l'une des méthodes montre une précision de 58% dans le test Caltech Pedestrian. Une autre méthode appelée VeryFast permet une prise de vue vidéo à 100 images / s (à titre de comparaison, Google tire à 15 images / s), mais la précision y est plus faible. Il existe des méthodes avec une précision plus élevée, mais elles fonctionnent beaucoup plus lentement, réduisant la vitesse à 195 fois.

Google Research s'est fixé pour objectif d'améliorer la précision de la reconnaissance sans sacrifier la vitesse. À 15 images / s, ils ont montré une augmentation spectaculaire de la précision à 73,8% .

L'expression «26,2% de taux moyen de manquements» dans un article scientifique ne doit pas être trompeuse: nous ne parlons pas du fait que la voiture a raté un piéton et n'a pas gagné de points comme à Carmageddon. Au contraire, la phrase signifie que cet algorithme «a raté» et n'a pas reconnu la personne à freiner devant lui.

Chez Google Research, le système de vision industrielle a été lancé sur l'accélérateur graphique GPU Nvidia K20 Tesla de l'ancienne génération. Maintenant, de nouvelles versions de K40 et K80 sont publiées, qui sont utilisées dans certains superordinateurs de la classe Top500.

L'équipe Google Research entend améliorer le résultat en augmentant la profondeur de la cascade de réseaux de neurones et en optimisant le rapport de performance et de précision.

D'une manière ou d'une autre, mais avec l'avènement des voitures robotiques dans les rues, il vaut mieux s'habiller plus lumineux que de camouflage pour que la vision industrielle de la voiture ne vous confonde pas avec le fond. D'un autre côté, de tels conseils peuvent être donnés même maintenant, lorsque les voitures sont souvent conduites par des conducteurs à moitié aveugles, à moitié ivres et distraits.

Source: https://habr.com/ru/post/fr382879/


All Articles