
Die britische ARM Corporation hat die heterogene Computerarchitektur von
ARM big.LITTLE verbessert, auf der alle führenden ARM-Mikroprozessoren auf Basis von Cortex-A7 (2011) basieren, und gestern die neue heterogene Architektur
DynamIQ big.LITTLE eingeführt . Auf Mikrochips wurde ein Platz für spezielle Hardwarebeschleuniger für Anwendungen des maschinellen Lernens zugewiesen. Vielleicht wird die Hardwareunterstützung für neuronale Netze in Zukunft ein neuer Trend unter Mikroprozessorentwicklern und die inhärente Qualität neuer Smartphones sein.
Das Architekturmerkmal der ARM big.LITTLE-Architektur ist das Vorhandensein von zwei Arten von Prozessorkernen: relativ langsam, energieeffizient (LITTLE) und relativ leistungsfähig und gefräßig (big). In der Regel aktiviert ein System nur einen von zwei Arten von Kernen: nur große oder nur kleine. Es ist klar, dass die Hintergrundaufgaben auf einem Smartphone oder einem anderen Gerät bequem mit kleinen Kernen gelöst werden können, die sehr wenig Energie verbrauchen. Bei Bedarf aktiviert der Prozessor leistungsstarke gefräßige Kerne, die im Multithread-Modus zusammen eine besonders hohe Leistung aufweisen. Im Prinzip haben alle Kerne Zugriff auf den gemeinsam genutzten Speicher, sodass Aufgaben für die gleichzeitige Ausführung auf beiden Kerntypen festgelegt werden können. Das heißt, groß und klein schalten sich im laufenden Betrieb ein.
Eine solche heterogene Architektur und das schnelle Umschalten von Aufgaben von einem Kerntyp zu einem anderen sollen dynamische Änderungen der Prozessorleistung und des Energieverbrauchs bewirken. ARM selbst gab an, dass bei einigen Aufgaben die Architektur bis zu 75% Energie spart.
DynamIQ big.LITTLE ist ein evolutionärer Schritt nach vorne. Mit der neuen Architektur können Sie eine Vielzahl von Kombinationen von großen und kleinen Kernen verwenden, die zuvor nicht möglich waren. Zum Beispiel 1 + 3, 2 + 4 oder 1 + 7 oder sogar 2 + 4 + 2 (Kerne mit drei verschiedenen Potenzen). Ein typisches Smartphone der Zukunft verfügt möglicherweise über ein Acht-Kern-System auf einem Chip mit zwei leistungsstarken Kernen, vier Kernen mit mittlerer und zwei Kernen mit geringer Leistung als Hintergrund.
Dank der Hardwareunterstützung für maschinelles Lernen und KI haben Entwickler Zugriff auf neue spezielle Prozessoranweisungen (z. B. Berechnungen mit begrenzter Genauigkeit). ARM
verspricht, dass Cortex-A-Prozessoren auf der neuen Architektur in den nächsten drei bis fünf Jahren eine bis zu 50-fache Leistungssteigerung in KI-Anwendungen im Vergleich zu aktuellen Cortex-A73-basierten Systemen und eine zusätzliche Steigerung aufgrund integrierter Beschleuniger auf dem Chip bieten werden. Der dedizierte Zugriffsport mit geringer Latenz zwischen der CPU und den Beschleunigern bietet eine 10-fache Leistung.

Dies bedeutet, dass trainierte neuronale Netze auf Smartphones viel besser funktionieren, einschließlich solcher, die Grafiken und Videos berechnen, Computer-Vision-Anwendungen und anderen Systemen, die große Datenströme verarbeiten.
Jeder Cluster kann bis zu acht Kerne mit unterschiedlichen Eigenschaften enthalten. Dies kann auch verwendet werden, um KI-Anwendungen im Vergleich zu aktuellen Systemen zu beschleunigen. Darüber hinaus bietet das neu gestaltete Speichersubsystem einen schnelleren Zugriff auf Daten und verbessert die Energieeffizienz. Übrigens ist es nicht erforderlich, LITTLE-Kerne mit schlechter Leistung in Kerncluster aufzunehmen, die normalerweise in Mobilgeräten verwendet werden, um Batteriestrom zu sparen. Wenn Sie unabhängig vom Energieverbrauch eine sehr hohe Leistung benötigen, macht sich niemand die Mühe, Cluster aus acht großen Kernen zu erstellen und diese zu besonders leistungsstarken Computersystemen zu kombinieren. ARM geht davon aus, dass dies den Umfang der ARM-Prozessoren über Smartphones hinaus erweitern wird.
Dynamisch unbegrenzte DynamIQ-Cluster mit gemeinsam genutztem Speicher - dies ist ein Angebot zur Erstellung leistungsfähiger Computersysteme für verschiedene Zwecke.

Eine zusätzliche Flexibilität bei der dynamischen Anpassung des Strom- / Energieverbrauchs wird durch die Funktion der individuellen Änderung der Taktfrequenz einzelner Prozessoren in einem Cluster mehrerer ARM-Prozessoren bereitgestellt. Entwickler aus Cambridge glauben, dass dies besonders wichtig für Helme der virtuellen Realität ist, die sich über lange Zeiträume in einem Zustand mit geringem Stromverbrauch befinden. Übergänge des Prozessors in einen der drei Energiezustände (EIN, AUS, SCHLAF) erfolgen viel schneller, automatisch auf Hardwareebene.
Letztendlich können Sie mit der erweiterten DynamIQ-Architektur zuverlässigere Systeme mit doppelten Funktionen erstellen, was das Sicherheitsniveau in eigenständigen Systemen erhöht, die auf Fehler reagieren müssen. Dies sind beispielsweise Computer-Vision-Systeme in unbemannten Fahrzeugen - Advanced Driver Assistance Systems (ADAS). Wenn ein Cluster von Kernen ausfällt oder der Beschleuniger ausfällt, übernimmt der andere Cluster automatisch seine Funktionen.

Die ARM-Prozessorarchitektur wird von vielen Herstellern, darunter Samsung, Qualcomm, Nvidia, Intel und Apple (iPhone, iPad), in ihren Chips unter Lizenz verwendet. Zwischen 2013 und 2017 wurden weltweit mehr als 50 Milliarden Mikrochips auf Basis der ARM-Architektur verkauft, und englische Entwickler hoffen, dass sich diese Zahl in den nächsten vier Jahren auf über 100 Milliarden verdoppeln wird.
Die meisten Geräte auf ARM-Prozessoren benötigen keine aktive Kühlung. Das Unternehmen ist zuversichtlich, dass mit der Leistungssteigerung dieser Systeme und dem Übergang zur DynamIQ-Architektur alles beim Alten bleiben wird.