Im Februar fand in Stanford eine HPC-Konferenz (High Performance Computing) statt. Vertreter von VMware sagten, dass das auf dem modifizierten ESXi-Hypervisor basierende System bei der Arbeit mit der GPU nicht schlechter als Bare-Metal-Lösungen ist.
Wir sprechen über die Technologien, mit denen dies erreicht werden konnte.
/ Foto Victorgrigas CC BY-SALeistungsproblem
Laut Analysten sind etwa 70% der Workloads in Rechenzentren
virtualisiert . Die restlichen 30% arbeiten jedoch immer noch mit Bare Metal ohne Hypervisoren. Diese 30% bestehen größtenteils aus hoch ausgelasteten Anwendungen, die sich beispielsweise auf das Training neuronaler Netze und die Verwendung von Grafikprozessoren beziehen.
Experten erklären diesen Trend damit, dass der Hypervisor als Zwischenabstraktionsebene die Leistung des gesamten Systems beeinflussen kann. In Studien vor fünf Jahren
finden Sie Daten zu einer Geschwindigkeitsabnahme um 10%. Daher haben Unternehmen und Betreiber von Rechenzentren es nicht eilig, die HPC-Last in eine virtuelle Umgebung zu übertragen.
Die Virtualisierungstechnologien entwickeln sich jedoch weiter und verbessern sich. Auf einer Konferenz vor einem Monat sagte VMware, dass der ESXi-Hypervisor die GPU-Leistung nicht beeinträchtigt. Die Rechengeschwindigkeit kann um drei Prozent sinken, was mit Bare Metal vergleichbar ist.
Wie funktioniert es?
Um die Leistung von HPC-Systemen mit GPUs zu verbessern, hat VMware eine Reihe von Änderungen an der Arbeit des Hypervisors vorgenommen. Insbesondere hat er die vMotion-Funktion abgeschafft. Es wird für den Lastenausgleich benötigt und überträgt normalerweise virtuelle Maschinen (VMs) zwischen Servern oder GPUs. Das Deaktivieren von vMotion hat dazu geführt, dass jeder VM jetzt ein bestimmter Grafikprozessor zugewiesen ist. Dies hat dazu beigetragen, die Kosten für den Datenaustausch zu senken.
Eine weitere Schlüsselkomponente des Systems
ist die DirectPath-E / A-
Technologie . Damit kann der CUDA-Treiber für paralleles Computing direkt mit virtuellen Maschinen interagieren und den Hypervisor umgehen. Wenn Sie mehrere VMs auf derselben GPU ausführen müssen, wird die GRID vGPU-Lösung aktiviert. Es unterteilt die Speicherkarte in mehrere Segmente (die Rechenzyklen sind jedoch nicht unterteilt).
Das Betriebsschema von zwei virtuellen Maschinen sieht in diesem Fall wie folgt aus:
Ergebnisse und Prognosen
Das Unternehmen
führte Hypervisor-
Tests durch, indem es ein auf
TensorFlow basierendes Sprachmodell
trainierte . Der „Produktivitätsschaden“ betrug im Vergleich zu Bare Metal nur 3-4%. Gleichzeitig konnte das System im Gegenzug Ressourcen bei Bedarf in Abhängigkeit von den aktuellen Lasten verteilen.
Der IT-Riese
führte auch Containertests
durch . Die Ingenieure des Unternehmens trainierten neuronale Netze, um Bilder zu erkennen. Gleichzeitig wurden die Ressourcen einer GPU auf vier Container-VMs verteilt. Infolgedessen verringerte sich die Leistung einzelner Computer um 17% (im Vergleich zu einer einzelnen VM, die vollen Zugriff auf GPU-Ressourcen hat). Die Anzahl der verarbeiteten Bilder pro Sekunde
hat sich jedoch verdreifacht. Es wird erwartet, dass solche Systeme im Bereich der Datenanalyse und Computermodellierung Anwendung
finden .
Unter den potenziellen Problemen, auf die VMware stoßen kann, wählen Experten
eine eher enge Zielgruppe aus. Eine kleine Anzahl von Unternehmen arbeitet derzeit mit Hochleistungssystemen. Obwohl Statista
feststellt, dass bis 2021 94% der Workloads der weltweiten Rechenzentren virtualisiert werden. Laut Analysten wird der Wert des HPC-Marktes zwischen 2017 und 2022 von 32 auf 45 Milliarden US-Dollar steigen.
/ Foto Global Access Point PDÄhnliche Lösungen
Es gibt verschiedene Analoga auf dem Markt, die von großen IT-Unternehmen entwickelt werden: AMD und Intel.
Das erste GPU-Virtualisierungsunternehmen
bietet einen SR-IOV-Ansatz (Single-Root-Input / Output-Virtualisierung) an. Diese Technologie bietet VMs Zugriff auf einige der Hardwarefunktionen des Systems. Mit der Lösung können Sie den Grafikprozessor auf 16 Benutzer mit virtualisierten Systemen mit gleicher Leistung aufteilen.
Die
Technologie des zweiten IT-Riesen
basiert auf dem Citrix XenServer 7-Hypervisor. Er kombiniert die Arbeit eines Standard-GPU-Treibers und einer virtuellen Maschine, mit deren Hilfe 3D-Anwendungen und Desktops auf den Geräten von Hunderten von Benutzern angezeigt werden können.
Zukunftstechnologie
Entwickler virtueller GPUs
setzen auf die Implementierung von KI-Systemen und die wachsende Beliebtheit von Hochleistungslösungen auf dem Markt für Geschäftstechnologien. Sie hoffen, dass der Bedarf an der Verarbeitung großer Datenmengen die Nachfrage nach vGPUs erhöhen wird.
Jetzt
suchen Hersteller
nach einer Möglichkeit , die Funktionalität von CPU und GPU in einem Kern
zu kombinieren, um die Lösung von Aufgaben im Zusammenhang mit Grafiken, mathematischen Berechnungen, logischen Operationen und Datenverarbeitung zu beschleunigen. Das zukünftige Erscheinen solcher Kerne auf dem Markt wird den Ansatz zur Ressourcenvirtualisierung und deren Verteilung zwischen Workloads in einer virtuellen und einer Cloud-Umgebung ändern.
Was Sie zu diesem Thema in unserem Unternehmensblog lesen sollten:
Ein paar Beiträge von unserem Telegrammkanal: