Le dernier processeur Eyeriss à 168 cœurs - un réseau de neurones dans notre smartphone

Bienvenue à nos lecteurs sur les pages du blog iCover ! Lors de l'International Solid State Circuits Conference (ISSCC-2016) qui s'est tenue début février à San Francisco, une équipe de développeurs du MIT (Massachusetts Institute of Technology) a présenté le prototype actuel de la puce de nouvelle génération Eyeriss, qui a été créée en tant que solution conceptuelle qui vous permet de recréer les capacités des algorithmes de réseau de neurones dans une large gamme d'appareils de faible puissance.



L'une des raisons objectives pour lesquelles les réseaux de neurones artificiels n'ont pas été correctement développés dans nos smartphones ou tablettes est le manque d'une alimentation compacte d'une puissance suffisante. En effet, les systèmes d'intelligence artificielle dits «cérébraux», «cérébraux», du moins sous la forme dans laquelle ils sont représentés par les technologies modernes, dépendent dans leur travail de puissants processeurs multicœurs qui consomment une quantité incroyable d'énergie par rapport à notre cerveau. En tout état de cause, jusqu'à récemment, il n'était pas possible d'imaginer de telles solutions au niveau des appareils de classe utilisateur. Dans le même temps, l'idée de «miniaturisation» de l'intelligence artificielle excite depuis longtemps les esprits des développeurs et, comme il s'avère, apporte déjà des résultats assez tangibles.

Les réseaux de neurones ont été au centre de l'attention des scientifiques dès les premiers jours de l'étude de l'intelligence artificielle, mais dans les années 1970, ils ont été quelque peu oubliés. Au cours de la dernière décennie, les technologies liées à l'utilisation des capacités des réseaux de neurones ont été étudiées au niveau des programmes de «deep learning».

«L'apprentissage profond a de nombreuses utilisations, telles que la reconnaissance d'objets, de la parole ou du visage», ont déclaré Vivienne Sze et Emanuel E. Landsman, professeur adjoint au Massachusetts Institute of Electrical and Computer Science, dont le groupe a développé nouvelle puce. «Désormais, les réseaux de neurones sont assez complexes et fonctionnent principalement sur des puces puissantes. Imaginez que vous pouvez transférer cette fonctionnalité sur votre téléphone mobile ou appareil intégré, puis traiter d'énormes quantités d'informations sans utiliser de connexion Wi-Fi. Le traitement de grandes quantités de données sur votre smartphone vous permettra d'éviter le retard résultant de l'échange de données avec le réseau, ce qui, à son tour, permettra à de nombreuses applications de fonctionner beaucoup plus efficacement. Et en plusla solution proposée assurera une nouvelle qualité de protection des informations confidentielles. »

Les réseaux de neurones, en règle générale, sont mis en œuvre sur la base de processeurs graphiques multicœurs (GPU). Lors d'une conférence internationale à San Francisco, les chercheurs du MIT ont dévoilé une nouvelle puce à 168 cœurs conçue pour implémenter des algorithmes d'intelligence artificielle basés sur des réseaux de neurones. Comparé à un GPU mobile (ce n'est pas indiqué, en comparaison avec lequel), le processeur a montré une efficacité 10 fois supérieure, ce qui vous permet d'utiliser un appareil mobile personnalisé pour exécuter localement de puissants algorithmes d'intelligence artificielle sans avoir besoin d'envoyer des données pour le traitement en nuage. Les faits saillants du développement sont reflétés dans le communiqué de presse du MIT du 3 février 2016.

La nouvelle puce, appelée par les développeurs d'Eyeriss, peut être largement utilisée dans l'Internet des objets, l'électronique portable, les véhicules autonomes, l'équipement de fabrication et même dans l'agriculture, aidant à résoudre et à coordonner les tâches actuelles. Avec des algorithmes d'intelligence artificielle à bord, les appareils mobiles seront en mesure de prendre des décisions au niveau local, fournissant à l'utilisateur un résultat prêt à l'emploi comme guide d'action, plutôt qu'un ensemble de données brutes provenant d'Internet. Et, bien sûr, l'une des applications des réseaux de neurones locaux est leur utilisation dans la création de robots autonomes à des fins diverses.

Diviser et conquérir


Les réseaux de neurones, en règle générale, ont une structure multicouche et chaque couche contient un grand nombre de nœuds de traitement. Au stade initial du traitement, les données arrivent et sont réparties entre les nœuds de la couche inférieure. Après avoir traité les données reçues par chacun des nœuds, le résultat est transmis pour traitement aux nœuds de la couche suivante. À la sortie de la dernière couche, le résultat de la résolution du problème est formé. En conséquence, pour résoudre des problèmes à grande échelle par l'algorithme décrit, des ressources informatiques importantes seront nécessaires.

Les exigences initialement présentées à la puce par les développeurs eux-mêmes les placent dans un cadre assez strict: d'une part, la solution doit être économe en énergie, d'autre part, elle doit fonctionner avec de simples blocs d'informations. Enfin, la puce doit avoir la capacité de simuler différents types de réseaux de neurones, en tenant compte des défis actuels. Toutes ces exigences ont été mises en œuvre avec succès dans le processeur Eyeriss.

La puce développée dans le laboratoire du MIT est un réseau neuronal déjà formé, localisé au niveau d'un processeur à 168 cœurs, qui pourra à l'avenir être intégré dans des appareils mobiles.

La clé de l'efficacité d'Eyeriss est de minimiser la fréquence des échanges de données entre les cœurs et les bancs de mémoire externes, une opération associée à une consommation d'énergie élevée et à des coûts de temps. Alors que les cœurs des GPU traditionnels sont liés à une banque de mémoire commune, chaque cœur Eyeriss possède sa propre mémoire. De plus, les données subissent une procédure de compression avant mandrin vers les cœurs voisins.

Un autre avantage de l'algorithme implémenté est la capacité des cœurs à «communiquer» directement entre eux, en contournant «l'intermédiaire» sous la forme d'un bus mémoire système. Il s'agit d'une caractéristique essentielle pour simuler le réseau neuronal convolutif (CNN). Tous les travaux de calcul nécessaires à la reconnaissance des formes et de la parole sont effectués localement à Eyeriss, sans avoir besoin d'accéder aux ressources du réseau, ce qui permet d'assurer le bon fonctionnement de l'appareil même en l'absence de réseau externe.

Enfin, un autre avantage d'Eyeriss est le principe de répartition «intelligente» des tâches informatiques individuelles entre les cœurs dans le cadre d'un seul problème résoluble. Dans sa mémoire locale, le noyau doit stocker non seulement les données traitées par les nœuds, mais également les données décrivant les nœuds eux-mêmes. Afin d'assurer des performances maximales du processus de traitement des données, ainsi que de charger Eyeriss avec la quantité maximale de données de la mémoire principale, l'algorithme de distribution des données des deux types est optimisé par une puce en temps réel spécialement conçue à cet effet, en tenant compte des caractéristiques du réseau neuronal actuel.

Lors de l'International Solid State Circuits Conference à San Francisco, l'équipe de développement, utilisant les capacités de la puce Eyeriss de niveau utilisateur, a démontré la mise en œuvre de l'algorithme de reconnaissance de formes au sein du réseau neuronal local. Une tâche similaire - notée dans un communiqué de presse - a été mise en œuvre plus tôt, mais au niveau des projets étatiques des plus modernes des réseaux de neurones créés.

«Ce travail est très important car il démontre à quel point les processeurs en profondeur intégrés efficacement peuvent fournir la puissance et les performances d'optimisation requises et apporter des processus informatiques complexes du cloud aux appareils mobiles», a déclaré Mike Polly, vice-président directeur du laboratoire de processeurs mobiles Innovation Lab de Samsung. ajoutant: «En plus d'une gamme innovante de solutions matérielles, une étude réalisée par des spécialistes du MIT démontre clairement comment le noyau intégré peut être utile pour le développement gestionnaire des applications utilisant une architecture de réseau standard et AlexNet Caffe ».

Le financement du projet Eyeriss, à commencer par la création d'une unité basée sur le laboratoire du MIT, a été partiellement financé par le département américain de la défense DARPA. Sans surprise, le premier à répondre à l'annonce du processeur avec un matériel éditorial impressionnant fut le célèbre analyste militaire Patrick Tucker. Selon lui, les nouveaux processeurs Eyeriss installés sur les appareils mobiles des soldats américains seront en mesure de résoudre les problèmes informatiques les plus complexes liés au traitement d'énormes quantités d'informations sans se connecter à un réseau commun.

Ainsi, à l'heure actuelle, l'US Air Force reçoit jusqu'à 1 500 heures de vidéo HD et jusqu'à 1 500 photos ultra-haute résolution de drones planant au-dessus de l'Afghanistan. De plus, tout ce flux d'informations sans fin doit être analysé visuellement par les opérateurs à l'ancienne, car le logiciel informatique existant n'est pas en mesure de distinguer un paysan errant un bâton le long d'un chemin de montagne d'un terroriste avec un lanceur de missiles guidés. Pour résoudre ces problèmes, des méthodes d'apprentissage automatique basées sur une formation représentative ont été initialement créées.

Les processeurs Eyeriss sont parfaitement adaptés à une installation sur des drones militaires sans pilote, car ils permettront le traitement intelligent d'un ensemble d'images et de vidéos à l'aide de technologies d'apprentissage en profondeur directement à bord de l'avion. Dans le même temps, les données utiles filtrées pourraient être envoyées directement aux unités de combat opérant dans la région spécifiée, contournant le centre pour l'analyse des informations opérationnelles.

Bref résumé

Au cours des expériences, la puce Eyeriss a démontré un niveau d'efficacité énergétique dix fois supérieur à celui des puces graphiques mobiles modernes. Dans le même temps, avec son aide, il s'avère technologiquement possible d'assurer le fonctionnement d'algorithmes d'intelligence artificielle sur des appareils de tailles compactes - des smartphones et tablettes - à l'électronique portable. Les retards créés par les réseaux lors de l'échange de données pour un tel processeur s'avèrent être minimisés, car la plupart des calculs peuvent être effectués localement par la puce. Sur la base d'Eyeriss, il sera possible de créer non seulement toutes sortes de «dispositifs intelligents», mais aussi des robots avec un certain degré d'indépendance dans la prise de décision.

Les développeurs du MIT n'ont pas encore défini d'intervalles de temps spécifiques pendant lesquels Eyeriss sera en mesure de se transformer en un produit commercial et de toute sa puissance pour révéler ses capacités au niveau des consommateurs. Une certaine implication dans le développement des meilleurs experts NVIDIA et le vif intérêt des chercheurs responsables de Samsung inspirent l'optimisme.

Source



Chers lecteurs, nous sommes toujours heureux de vous rencontrer et de vous attendre sur les pages de notre blog. Nous sommes prêts à continuer de partager avec vous les dernières nouvelles, à examiner les documents et autres publications, et nous ferons de notre mieux pour rendre le temps passé avec nous utile pour vous. Et bien sûr, n'oubliez pas de vous abonner à nos rubriques . Nos autres articles et événements

Sélection spéciale de cadeaux pour le 23 février et le 8 mars d'iCover



Source: https://habr.com/ru/post/fr390627/


All Articles