Warum brauchen wir ein Überwachungssystem auf einem Chip?

Das britische Startup UltraSoC führte die On-Chip-Technologie ein, um die Chipleistung zu verfolgen, ohne die Leistung zu beeinträchtigen. Wir erklären Ihnen, wie die Lösung funktioniert.


/ Foto 83DegreesMedia CC BY

Warum Überwachungssysteme in einem Chip implementieren?


Heterogene Geräte bestehen aus mehreren Blöcken. Dies können Prozessoren, Coprozessoren oder ASICs mit integrierten Schaltkreisen sein. Die Spezialisierung von Computermodulen verbessert die Leistung des gesamten Systems, aber die „Mehrkomponentenzusammensetzung“ führt zu Schwierigkeiten bei der Optimierung - jede Hardwareeinheit muss optimiert werden.

Das Problem verschärft sich, wenn die Chips von einem großen Rechenzentrum verwendet werden. Die Überwachung einer riesigen Infrastruktur ist keine leichte Aufgabe. Spezielle Softwarelösungen beeinträchtigen häufig die Effizienz von Computersystemen. Das Dienstprogramm zum Messen der Bandbreite des iPerf- Kanals reduziert beispielsweise die Netzwerkleistung um 10-15%.

Um dieses Problem zu lösen, implementierte UltraSoC Überwachungstools direkt auf dem Chip. Das Unternehmen hat eine Reihe von logischen Halbleitermodulen entwickelt, von denen jedes für eine der Aufgaben verantwortlich ist - Überwachung, Debugging, Sicherheit. Chiphersteller können diese Module verwenden und sie mit Prozessoren, GPUs und Netzwerkschnittstellen auf dieselbe Schaltung legen. Auf diese Weise können Sie Daten von allen Komponenten des Chips "an Ort und Stelle" ohne invasive Softwarelösungen erfassen. Diese Technologie wurde bereits für die Arbeit mit Standardarchitekturen angepasst : von ARM und RISC-V bis zu MIPS und Xtensa.

Systemgerät


UltraSoC bietet ungefähr 30 Module an, die abhängig von den Eigenschaften eines bestimmten Systems auf einem Chip (SoC) zusammengebaut werden können. Die Module sind in drei Klassen unterteilt:

  1. Analyseblöcke - Steuern und Überwachen der Komponenten des Chips;
  2. Messaging-Blöcke - Verbinden Sie UltraSoC-Module miteinander.
  3. Kommunikatoren - Schnittstellen für die Kommunikation mit externen Systemen und internen Komponenten.

Bei Mikroprozessoren, die auf der RISC-V-Architektur basieren, kann das gesamte System beispielsweise folgendermaßen aussehen :



Die erhaltenen Daten zum Zustand der Chipkomponenten können über verschiedene Schnittstellen angezeigt werden: USB, Ethernet, PCI-Express und sogar Wi-Fi. Danach können diese Informationen in jedes Analysesystem heruntergeladen werden, um nach Anomalien im Betrieb der Komponenten zu suchen.

Potenziale und Nachteile der Lösung


UltraSoC-Entwickler sagen, dass ihr System in Rechenzentren Anwendung finden und Cloud-Anbietern bei der Überwachung einer großen Cloud-Infrastruktur helfen wird. Da Systemparameter auf einem Chip mit Hardware überwacht werden, die (im Gegensatz zu Software) die Leistung nicht beeinträchtigt, können Rechenzentrumsbetreiber aktuelle Serverstatusdaten in Echtzeit empfangen.

Aufgrund der Tatsache, dass die Technologie den Betrieb von Low-Level-Komponenten direkt bewertet, hilft es, die Ursache der sogenannten Heisenbags schnell zu bestimmen - „schwebende Fehler“, die aufgrund der Tatsache, dass sie regelmäßig ihre Eigenschaften ändern, schwer zu erkennen sind.

Bevor die Technologie jedoch weit verbreitet werden kann, muss das UltraSoC-Team die Hersteller davon überzeugen, die Lösung in ihre Chips zu integrieren. Die Implementierung wird Geschäftsprozesse komplizieren, zu höheren Produktionskosten und einem Preisanstieg für Mikroschaltungen führen. Daher lehnen viele Unternehmen dies möglicherweise ab, da es für Kunden günstiger ist, Überwachungssoftware von Drittanbietern selbst zu verwenden.

Einige Hersteller möchten das Produkt jedoch noch testen. Esperanto beabsichtigt beispielsweise, die UltraSoC-Technologie in tausend RISC-V-basierten Prozessoren und AI / ML-Beschleunigern einzusetzen , um deren Leistung zu verfolgen.

Alternative Entwicklungen


Andere Organisationen entwickeln ebenfalls On-Chip-Systeme. Insbesondere spezielle Sensoren zur Überwachung von Spannung und Temperatur (PVT - Prozess, Spannung, Temperatur). Sie sind Grundlage für die Arbeit in Systemen auf einem Chip und ASIC. Anfang letzten Jahres hat Moortec die Unterstützung des Chipherstellers TSMC in Anspruch genommen und seine Technologie in 12-nm-Chips implementiert. Das Unternehmen ist zuversichtlich, dass Prozessoren mit integrierten Überwachungssystemen in Rechenzentren, Mobilgeräten, KI-Systemen, IoT usw. Anwendung finden werden.

Ein weiteres Projekt - „intelligente“ PVT-Sensoren - war das Ergebnis gemeinsamer Arbeit der Unternehmen. Die Kombination aus digitalen Überwachungs- und Analysesystemen UltraSoC und physikalischen Sensoren Moortec ermöglicht es Ihnen, den Status von SoC umfassend zu überwachen und die Last in Echtzeit zu optimieren.

Was erwartet die Technologie in der Zukunft?


Entwickler von UltraSoC glauben, dass die wachsende Beliebtheit von High-Tech-Lösungen (AI, ML, IoT) sowie der Übergang zu heterogenen Systemen integrierte Überwachungstools unverzichtbar machen werden.

Das Unternehmen plant, die Lösungsarchitektur flexibler und anpassbarer zu gestalten. Zu diesem Zweck begann UltraSoC mit der Entwicklung von UltraDevelop 2. Dies ist eine integrierte Entwicklungsumgebung (IDE), mit der Sie die Parameter der Chipkomponenten konfigurieren, debuggen und optimieren können. Die Veröffentlichung ist für das zweite Quartal 2019 geplant.



Worüber wir in einem Unternehmensblog schreiben:


Mehrere Beiträge aus unserem Telegrammkanal:

Source: https://habr.com/ru/post/de442788/


All Articles