Der neueste 168-Kern-Eyeriss-Prozessor - ein neuronales Netzwerk in unserem Smartphone

Willkommen bei unseren Lesern auf den iCover- Blog- Seiten ! Auf der Internationalen Festkörper-Schaltkreiskonferenz (ISSCC-2016) Anfang Februar in San Francisco demonstrierte ein Entwicklerteam des MIT (Massachusetts Institute of Technology) einen funktionierenden Prototyp eines Eyeriss-Chips der neuen Generation, der als konzeptionelle Lösung entwickelt wurde, mit der Sie die Funktionen neuronaler Netzwerkalgorithmen neu erstellen können in einer Vielzahl von Geräten mit geringem Stromverbrauch.



Einer der objektiven Gründe, warum künstliche neuronale Netze in unseren Smartphones oder Tablets nicht richtig entwickelt wurden, ist das Fehlen einer kompakten Stromversorgung mit ausreichender Leistung. In der Tat hängen die sogenannten gehirnähnlichen, „gehirnähnlichen“ Systeme der künstlichen Intelligenz, zumindest in der Form, in der sie durch moderne Technologien dargestellt werden, in ihrer Arbeit von leistungsstarken Mehrkernprozessoren ab, die im Vergleich zu unserem Gehirn unglaublich viel Energie verbrauchen. Auf jeden Fall war es bis vor kurzem nicht möglich, sich solche Lösungen auf der Ebene von Geräten der Benutzerklasse vorzustellen. Gleichzeitig erregt die Idee der „Miniaturisierung“ der künstlichen Intelligenz die Entwickler seit langem und bringt, wie sich herausstellt, bereits greifbare Ergebnisse.

Neuronale Netze standen seit den ersten Tagen des Studiums der künstlichen Intelligenz im Mittelpunkt der Aufmerksamkeit von Wissenschaftlern, wurden jedoch in den 1970er Jahren etwas vergessen. In den letzten zehn Jahren wurden Technologien im Zusammenhang mit der Nutzung der Fähigkeiten neuronaler Netze auf der Ebene von „Deep Learning“ -Programmen untersucht.

"Deep Learning hat viele Verwendungszwecke wie Objekt-, Sprach- oder Gesichtserkennung", so Vivienne Sze und Emanuel E. Landsman, Associate Professor am Massachusetts Institute of Electrical and Computer Engineering, dessen Gruppe sich entwickelte neuer Chip. „Neuronale Netze sind mittlerweile recht komplex und arbeiten hauptsächlich mit leistungsstarken Chips. Stellen Sie sich vor, Sie können diese Funktionalität auf Ihr Mobiltelefon oder eingebautes Gerät übertragen und dann große Mengen an Informationen verarbeiten, ohne eine Wi-Fi-Verbindung zu verwenden. Durch die Verarbeitung großer Datenmengen auf Ihrem Smartphone können Sie Verzögerungen vermeiden, die durch den Datenaustausch mit dem Netzwerk entstehen, wodurch viele Anwendungen wesentlich effizienter arbeiten können. Und außerdemDie vorgeschlagene Lösung wird eine neue Qualität des Schutzes vertraulicher Informationen gewährleisten. “

Neuronale Netze werden in der Regel auf Basis von Multi-Core-Grafikprozessoren (GPUs) implementiert. Auf einer internationalen Konferenz in San Francisco stellten MIT-Forscher einen neuen 168-Kern-Chip vor, mit dem Algorithmen für künstliche Intelligenz basierend auf neuronalen Netzen implementiert werden können. Im Vergleich zu einer mobilen GPU (im Vergleich zu welcher nicht angegeben) hat der Prozessor eine zehnmal höhere Effizienz gezeigt, sodass Sie mit einem benutzerdefinierten mobilen Gerät leistungsstarke Algorithmen für künstliche Intelligenz lokal ausführen können, ohne Daten für die Cloud-Verarbeitung senden zu müssen. Höhepunkte der Entwicklung spiegeln sich in der MIT- Pressemitteilung vom 3. Februar 2016 wider .

Der neue Chip, der von den Entwicklern von Eyeriss genannt wird, kann im Internet der Dinge, in tragbarer Elektronik, in selbstfahrenden Fahrzeugen, in Fertigungsanlagen und sogar in der Landwirtschaft weit verbreitet eingesetzt werden, um aktuelle Aufgaben zu lösen und zu koordinieren. Mit Algorithmen für künstliche Intelligenz an Bord können mobile Geräte Entscheidungen auf lokaler Ebene treffen und dem Benutzer ein vorgefertigtes Ergebnis als Leitfaden für Maßnahmen liefern, anstatt eine Reihe von Rohdaten aus dem Internet. Und natürlich ist eine der Anwendungen lokaler neuronaler Netze ihre Verwendung bei der Schaffung autonomer Roboter für verschiedene Zwecke.

Teilen und erobern


Neuronale Netze haben in der Regel eine Mehrschichtstruktur und jede Schicht enthält eine große Anzahl von Verarbeitungsknoten. In der Anfangsphase der Verarbeitung kommen Daten an und werden zwischen den Knoten der unteren Schicht verteilt. Nach der Verarbeitung der empfangenen Daten durch jeden der Knoten wird das Ergebnis zur Verarbeitung an die Knoten der nächsten Schicht übertragen. Am Ausgang der letzten Schicht wird das Ergebnis der Lösung des Problems gebildet. Dementsprechend sind zur Lösung von Problemen im großen Maßstab durch den beschriebenen Algorithmus erhebliche Rechenressourcen erforderlich.

Die Anforderungen, die die Entwickler ursprünglich an den Chip stellten, stellten sie in einen ziemlich strengen Rahmen: Einerseits sollte die Lösung energieeffizient sein, andererseits sollte sie mit einfachen Informationsblöcken arbeiten. Schließlich muss der Chip in der Lage sein, verschiedene Arten von neuronalen Netzen unter Berücksichtigung der aktuellen Herausforderungen zu simulieren. Alle diese Anforderungen wurden erfolgreich im Eyeriss-Prozessor implementiert.

Der im MIT-Labor entwickelte Chip ist ein bereits gebildetes neuronales Netzwerk, das auf der Ebene eines 168-Kern-Prozessors lokalisiert ist und in Zukunft in mobile Geräte integriert werden kann.

Der Schlüssel zur Effizienz von Eyeriss besteht darin, die Häufigkeit des Datenaustauschs zwischen den Kernen und externen Speicherbänken zu minimieren, was mit einem hohen Stromverbrauch und Zeitkosten verbunden ist. Während die Kerne herkömmlicher GPUs an eine gemeinsame Speicherbank gebunden sind, verfügt jeder Eyeriss-Kern über einen eigenen Speicher. Zusätzlich werden die Daten vor dem Dorn zu benachbarten Kernen einem Komprimierungsverfahren unterzogen.

Ein weiterer Vorteil des implementierten Algorithmus ist die Fähigkeit der Kerne, direkt miteinander zu "kommunizieren", wobei der "Vermittler" in Form eines Systemspeicherbusses umgangen wird. Dies ist eine wichtige Funktion für die Simulation des Convolutional Neural Network (CNN). Alle für die Muster- und Spracherkennung erforderlichen Rechenarbeiten werden lokal in Eyeriss ausgeführt, ohne dass auf Netzwerkressourcen zugegriffen werden muss, wodurch das effektive Funktionieren des Geräts auch ohne externes Netzwerk sichergestellt werden kann.

Ein weiterer Vorteil von Eyeriss ist das Prinzip der „intelligenten“ Verteilung einzelner Computeraufgaben zwischen Kernen im Rahmen eines einzigen lösbaren Problems. In seinem lokalen Speicher muss der Kernel nicht nur die von den Knoten verarbeiteten Daten speichern, sondern auch die Daten, die die Knoten selbst beschreiben. Um eine maximale Leistung des Datenverarbeitungsprozesses zu gewährleisten und Eyeriss mit der maximalen Datenmenge aus dem Hauptspeicher zu laden, wird der Datenverteilungsalgorithmus beider Typen durch einen speziell für diesen Zweck entwickelten Echtzeitchip unter Berücksichtigung der Eigenschaften des aktuellen neuronalen Netzes optimiert.

Auf der International Solid State Circuits Conference in San Francisco demonstrierte das Entwicklungsteam unter Verwendung der Funktionen des Eyeriss-Chips auf Benutzerebene die Implementierung des Mustererkennungsalgorithmus innerhalb des lokalen neuronalen Netzwerks. Eine ähnliche Aufgabe - in einer Pressemitteilung erwähnt - wurde früher umgesetzt, jedoch auf der Ebene von Regierungsprojekten des modernsten der geschaffenen neuronalen Netze.

„Diese Arbeit ist sehr wichtig, da sie zeigt, wie effizient eingebettete Prozessoren für eingehende Studien in der Lage sind, die erforderliche Leistung und Optimierungsleistung bereitzustellen und komplexe Computerprozesse aus der Cloud auf mobile Geräte zu übertragen“, sagt Mike Polly, Senior Vice President des Samsung Innovation Lab-Labors für mobile Prozessoren. Hinzufügen: „Neben einer innovativen Reihe von Hardwarelösungen zeigt eine Studie von MIT-Spezialisten deutlich, wie nützlich der eingebettete Kern für die Entwicklung sein kann Handler Anwendungen, die eine Standard-Netzwerkarchitektur und AlexNet Caffe mit ».

Die Finanzierung des Eyeriss-Projekts, beginnend mit der Schaffung einer Einheit auf der Grundlage des MIT-Labors, wurde teilweise vom US-Verteidigungsministerium DARPA finanziert. Es überrascht nicht, dass Patrick Tucker, ein bekannter Militäranalyst, als erster auf die Ankündigung des Verarbeiters mit beeindruckendem redaktionellem Material reagierte. Ihm zufolge werden die neuen Eyeriss-Prozessoren, die auf Mobilgeräten von US-Soldaten installiert sind, in der Lage sein, die komplexesten Rechenprobleme zu lösen, die mit der Verarbeitung großer Informationsmengen verbunden sind, ohne eine Verbindung zu einem gemeinsamen Netzwerk herzustellen.

Derzeit empfängt die US-Luftwaffe bis zu 1.500 Stunden HD-Video und bis zu 1.500 hochauflösende Fotos von Drohnen, die über Afghanistan schweben. Darüber hinaus muss all dieser endlose Informationsstrom von den Bedienern auf altmodische Weise visuell analysiert werden, da die vorhandene Computersoftware einen Bauern, der einen Stock entlang eines Bergpfades wandert, nicht von einem Terroristen mit einem Werfer für Lenkwaffen unterscheiden kann. Um solche Probleme zu lösen, wurden zunächst Methoden des maschinellen Lernens entwickelt, die auf repräsentativen Schulungen basieren.

Eyeriss-Prozessoren eignen sich ideal für die Installation auf unbemannten Militärdrohnen, da sie die intelligente Verarbeitung einer Reihe von Bildern und Videos mithilfe von Deep-Learning-Technologien direkt an Bord des Flugzeugs ermöglichen. Gleichzeitig könnten die gescreenten nützlichen Daten direkt an Kampfeinheiten gesendet werden, die in der angegebenen Region operieren, wobei das Zentrum zur Analyse von Betriebsinformationen umgangen wird.

Kurze Zusammenfassung

Während der Experimente zeigte der Eyeriss-Chip eine zehnmal höhere Energieeffizienz als moderne mobile Grafikchips. Gleichzeitig stellt sich heraus, dass es mit seiner Hilfe technologisch möglich ist, den Betrieb von Algorithmen für künstliche Intelligenz auf Geräten mit kompakten Größen - von Smartphones und Tablets - bis hin zu tragbarer Elektronik sicherzustellen. Die Verzögerungen, die Netzwerke während des Datenaustauschs für einen solchen Prozessor verursachen, erweisen sich als minimiert, da die meisten Berechnungen lokal vom Chip durchgeführt werden können. Auf der Basis von Eyeriss können nicht nur alle Arten von „intelligenten Geräten“ geschaffen werden, sondern auch Roboter mit einem gewissen Maß an Unabhängigkeit bei der Entscheidungsfindung.

MIT-Entwickler haben noch keine spezifischen Zeitintervalle angegeben, in denen sich Eyeriss in ein kommerzielles Produkt verwandeln kann und in seiner ganzen Kraft seine Fähigkeiten auf Verbraucherebene offenbaren kann. Eine gewisse Beteiligung an der Entwicklung führender NVIDIA-Experten und das große Interesse verantwortungsbewusster Samsung-Forscher wecken Optimismus.

Quelle



Liebe Leserinnen und Leser, wir freuen uns immer, Sie auf den Seiten unseres Blogs zu treffen und auf Sie zu warten. Wir sind bereit, Ihnen weiterhin die neuesten Nachrichten, Überprüfungsmaterialien und andere Veröffentlichungen mitzuteilen und werden unser Bestes tun, um die mit uns verbrachte Zeit für Sie nützlich zu machen. Und vergessen Sie natürlich nicht, unsere Abschnitte zu abonnieren . Unsere anderen Artikel und Veranstaltungen

Spezielle Auswahl an Geschenken für den 23. Februar und den 8. März von iCover



Source: https://habr.com/ru/post/de390627/


All Articles