Les systèmes de vision industrielle peuvent reconnaître les visages au même niveau que les gens et même créer des visages artificiels réalistes. Mais les chercheurs ont découvert que ces systèmes ne peuvent pas reconnaître les illusions d'optique et, par conséquent, en créer de nouvelles.

La vue humaine est un appareil étonnant. Bien qu'il se soit développé dans un environnement particulier pendant des millions d'années, il est capable de tâches qui ne sont jamais tombées sur les premiers systèmes visuels. Un bon exemple serait la lecture ou la définition d'objets artificiels - voitures, avions, panneaux de signalisation, etc.
Mais le système visuel a un ensemble bien connu de défauts que nous percevons comme des illusions d'optique. Les chercheurs ont déjà identifié de nombreuses options dans lesquelles ces illusions amènent les gens à évaluer incorrectement la couleur, la taille, la position relative et le mouvement.
Les illusions en elles-mêmes sont intéressantes en ce qu'elles donnent une idée de la nature du système visuel et de la perception. Par conséquent, il sera très utile de trouver un moyen de trouver de nouvelles illusions qui aideront à étudier les limites de ce système.
Cercles concentriques?Ici, nous devrions venir dans une formation approfondie pratique. Ces dernières années, les machines ont appris à reconnaître des objets et des visages dans des images, puis à créer des images similaires. Il est facile d'imaginer qu'un système de vision industrielle devrait être capable de reconnaître les illusions et de créer les siennes.
Ici, Robert Williams et Roman Yampolsky de l'Université de Louisville au Kentucky montent sur scène. Ces gars ont
essayé de lancer une telle chose , mais ont trouvé que tout n'était pas si simple. Les systèmes d'apprentissage automatique existants ne sont pas capables de fournir leurs propres illusions d'optique - du moins pas encore. Pourquoi
Tout d'abord, des informations générales. Les progrès récents de l'apprentissage en profondeur reposent sur deux percées. Le premier est la disponibilité de puissants réseaux de neurones et quelques astuces logicielles qui leur permettent de bien apprendre.
La seconde est la création d'énormes bases de données balisées en volume, sur la base desquelles les machines peuvent apprendre. Par exemple, pour apprendre à une machine à reconnaître les visages, il faut des dizaines de milliers d'images contenant des visages clairement marqués. Grâce à ces informations, le réseau neuronal peut apprendre à reconnaître les schémas caractéristiques des visages - deux yeux, un nez et une bouche. Encore plus impressionnant, une paire de réseaux - les soi-disant
Réseau génératif-compétitif (GSS) - capable de s'instruire mutuellement pour créer des images réalistes et complètement artificielles de visages.
Williams et Yampolsky ont conçu pour enseigner au réseau neuronal de déterminer les illusions d'optique. La capacité de calcul est suffisante et il n'y a pas suffisamment de bases de données appropriées. Par conséquent, leur première tâche a été de créer une base de données d'illusions d'optique pour la formation.
Cela s'est avéré difficile à faire. "Il n'y a que quelques milliers d'illusions d'optique statiques, et le nombre de types uniques d'illusions est très faible - peut-être quelques dizaines", disent-ils.
Et c'est un sérieux obstacle aux systèmes modernes d'apprentissage automatique. «La création d'un modèle qui peut apprendre d'un ensemble de données aussi petit et limité sera un énorme pas en avant pour les modèles génératifs et une compréhension de la vision humaine», disent-ils.
Par conséquent, Williams et Yampolsky ont collecté une base de données de plus de 6 000 images d'illusions d'optique et ont formé le réseau neuronal à les reconnaître. Ensuite, ils ont créé le GSS, qui devrait créer indépendamment des illusions d'optique.
Les résultats les ont déçus. "Après sept heures de formation sur le Nvidia Tesla K80, rien de valable n'a été créé", ont déclaré des chercheurs, qui ont ouvert la base de données pour que tout le monde puisse l'utiliser.
Le résultat est cependant intéressant. «Les seules illusions d'optique que nous connaissons ont été créées par l'évolution (par exemple, les motifs oculaires sur les ailes de papillon) ou par des artistes humains», soulignent-ils. Et dans les deux cas, les gens ont joué un rôle crucial en fournissant des commentaires - les gens peuvent voir l'illusion.
Et les systèmes de vision industrielle ne le peuvent pas. «Il est peu probable que l'ESG apprenne à tromper la vision sans comprendre les principes qui sous-tendent les illusions», déclarent Williams et Yampolsky.
Cela peut être difficile, car il existe des différences critiques entre les systèmes visuels de l'homme et de la machine. De nombreux chercheurs créent des réseaux de neurones qui rappellent encore plus le système visuel humain. Peut-être l'un des contrôles intéressants pour ces systèmes sera de savoir s'ils peuvent voir l'illusion.
En attendant, Williams et Yampolsky ne sont pas optimistes: «Apparemment, un ensemble de données avec des illusions peut ne pas être suffisant pour créer de nouvelles illusions», disent-ils. Donc pour l'instant, les illusions d'optique restent un bastion de la perception humaine, non soumises aux machines.