Nouveaux processeurs ARM prĂŞts pour les applications d'IA



La British ARM Corporation a amélioré l'architecture informatique hétérogène d' ARM big.LITTLE , sur laquelle sont basés tous les principaux microprocesseurs ARM basés sur Cortex-A7 (2011), et a présenté hier la nouvelle architecture hétérogène DynamIQ big.LITTLE . Une place a été attribuée aux micropuces pour les accélérateurs matériels spéciaux destinés aux applications d'apprentissage automatique. Peut-être qu'à l'avenir, la prise en charge matérielle des réseaux de neurones deviendra une nouvelle tendance chez les développeurs de microprocesseurs et la qualité inhérente des nouveaux smartphones.

La caractéristique architecturale de l'architecture ARM big.LITTLE est la présence de deux types de cœurs de processeur: relativement lent, économe en énergie (LITTLE) et relativement puissant et gourmand (gros). En règle générale, un système n'active qu'un seul des deux types de cœurs: uniquement grand ou petit. Il est clair que les tâches d'arrière-plan sur un smartphone ou un autre appareil sont faciles à résoudre avec de petits cœurs qui consomment très peu d'énergie. Si nécessaire, le processeur active de puissants noyaux gloutons qui, en mode multi-thread, travaillant ensemble, présentent des performances particulièrement élevées. En principe, tous les cœurs ont accès à la mémoire partagée, de sorte que les tâches peuvent être définies pour être exécutées sur les deux types de cœurs en même temps. Autrement dit, les grands et les petits basculent à la volée.

Une telle architecture hétérogène et des tâches de commutation à la volée d'un type de cœur à un autre sont conçues pour créer des changements dynamiques dans la puissance du processeur et la consommation d'énergie. ARM lui-même a déclaré que dans certaines tâches, l'architecture économise jusqu'à 75% d'énergie.

DynamIQ big.LITTLE est un pas en avant évolutif. La nouvelle architecture vous permet d'utiliser une variété de combinaisons de grands et petits cœurs qui n'étaient pas possibles auparavant. Par exemple, 1 + 3, 2 + 4 ou 1 + 7, voire 2 + 4 + 2 (noyaux de trois puissances différentes). Un smartphone typique du futur peut avoir un système à huit cœurs sur une puce avec deux cœurs puissants, quatre cœurs moyens et deux cœurs peu performants en arrière-plan.

Avec la prise en charge matérielle de l'apprentissage automatique et de l'intelligence artificielle, les développeurs auront accès à de nouvelles instructions spéciales du processeur (par exemple, des calculs avec une précision limitée). ARM promet qu'au cours des trois à cinq prochaines années, les processeurs Cortex-A de la nouvelle architecture fourniront jusqu'à 50 fois plus de performances dans les applications d'IA, par rapport aux systèmes actuels basés sur Cortex-A73 et une augmentation supplémentaire en raison d'accélérateurs intégrés sur la puce. Le port d'accès dédié à faible latence entre le processeur et les accélérateurs offre des performances 10 fois supérieures.



Cela signifie que les réseaux de neurones formés fonctionneront beaucoup mieux sur les smartphones, y compris ceux qui calculent les graphiques et la vidéo, les applications de vision par ordinateur et d'autres systèmes qui traitent de gros flux de données.

Chaque cluster peut contenir jusqu'à huit cœurs de caractéristiques différentes. Cela peut également être utilisé pour accélérer les applications d'IA par rapport aux systèmes actuels. De plus, le sous-système de mémoire repensé fournira un accès plus rapide aux données et améliorera l'efficacité énergétique. Soit dit en passant, il n'est pas nécessaire d'inclure les petits cœurs aux performances médiocres dans les grappes de cœurs, qui sont généralement utilisés dans les appareils mobiles pour économiser la batterie. Si vous avez besoin de performances très élevées quelle que soit la consommation d'énergie, personne ne se soucie de créer des grappes de huit grands cœurs et de les combiner en des systèmes informatiques particulièrement puissants. ARM estime que cela étendra la portée des processeurs ARM au-delà des smartphones.

Clusters DynamIQ d'une échelle presque illimitée avec mémoire partagée - il s'agit d'une offre pour créer des systèmes informatiques puissants à des fins diverses.



Une flexibilité supplémentaire dans l'ajustement dynamique de la puissance / consommation d'énergie sera fournie par la fonction de changement individuel de la fréquence d'horloge des processeurs individuels dans un groupe de processeurs ARM multiples. Les développeurs de Cambridge estiment que cela est particulièrement important dans les casques de réalité virtuelle, qui pendant de longues périodes sont dans un état de faible consommation d'énergie. Les transitions du processeur vers l'un des trois états d'énergie (ON, OFF, SLEEP) sont effectuées beaucoup plus rapidement, automatiquement au niveau matériel.

Au final, l'architecture avancée DynamIQ vous permet de construire des systèmes plus fiables avec duplication de fonctions, ce qui augmente le niveau de sécurité des systèmes autonomes qui doivent répondre aux pannes. Par exemple, il s'agit de systèmes de vision par ordinateur dans les véhicules sans pilote - Advanced Driver Assistance Systems (ADAS). Lorsqu'un cluster de cœurs échoue ou que l'accélérateur tombe en panne, l'autre cluster reprend automatiquement ses fonctions.



L'architecture du processeur ARM est utilisée sous licence dans leurs puces par de nombreux fabricants, notamment Samsung, Qualcomm, Nvidia, Intel et Apple (iPhone, iPad). Entre 2013 et 2017, plus de 50 milliards de micropuces basées sur l'architecture ARM ont été vendues dans le monde, et les développeurs anglais espèrent qu'au cours des quatre prochaines années, ce nombre doublera pour atteindre plus de 100 milliards.

La plupart des périphériques des processeurs ARM n'ont pas besoin d'un refroidissement actif. La société est convaincue qu'avec l'augmentation de la puissance de ces systèmes et la transition vers l'architecture DynamIQ, tout restera le même.

Source: https://habr.com/ru/post/fr402501/


All Articles