vGPU - Verwendung kann nicht ignoriert werden



Von Juni bis Juli wandten sich fast zwei Dutzend Unternehmen an uns, die an den Funktionen virtueller GPUs interessiert waren. Die „Grafiken“ von Cloud4Y werden bereits von einer der größten Tochtergesellschaften der Sberbank verwendet, aber im Allgemeinen ist der Service nicht sehr beliebt. Diese Aktivität hat uns sehr gefallen. Angesichts des wachsenden Interesses an Technologie haben wir uns entschlossen, etwas mehr über vGPU zu sprechen.

"Seen der Daten", die als Ergebnis wissenschaftlicher Experimente und Forschungen, Deep Learning und anderer Arbeitsbereiche mit KI, Modellierung großer und komplexer Objekte erhalten wurden - all dies erfordert eine leistungsstarke Hardware. Nun, wenn es so ist und Sie aktuelle Probleme schnell lösen können. Dies liegt nur an der zunehmenden Komplexität der Aufgaben (hauptsächlich für Geschäftsanalysen, Rendering, DL-Algorithmen und Frameworks). Die Hardwarekapazitäten von Desktop- und sogar Server-CPUs werden zunehmend unbrauchbar.

Die Lösung wurde in der Verwendung von GPU-Computing gefunden. Diese Grafikbeschleunigungstechnologie ermöglicht die gemeinsame Nutzung von Ressourcen einer GPU zwischen mehreren virtuellen Computern. Die GPU wurde ursprünglich für die Arbeit mit Grafiken entwickelt, da sie aus Tausenden kleiner Kerne besteht, die für die effiziente Verarbeitung paralleler Aufgaben verwendet werden. Gleichzeitig wird ein Teil der ressourcenintensivsten Berechnungen auf der GPU durchgeführt, den Rest erledigt die CPU.



GPU-Computing wurde bereits 2007 von Nvidia erfunden. Heute hat diese Technologie ein neues Niveau erreicht und wird in Rechenzentren der größten Unternehmen und wissenschaftlichen Labors eingesetzt. Der traditionelle Ansatz hat jedoch einen wesentlichen Nachteil: Der Kauf von physischer Ausrüstung ist sehr teuer. Und wenn Sie sich an die Geschwindigkeit der Veralterung des "Eisens" erinnern, wird es noch trauriger.

Das Problem soll die Technologie virtueller Grafikprozessoren lösen: vGPU. Damit können Benutzer schwere Anwendungen wie AutoCAD, 3DS Max, Maya und Sony Vegas Pro aus der Ferne starten. Die Virtualisierung gewann schnell ihren Marktanteil. Welcher russische Datenwissenschaftler mag Fast Computing auf NVidia Tesla-Grafikkarten nicht?

Es ist erwähnenswert, dass vor dem Aufkommen von vGPU andere Methoden zur Beschleunigung der Grafikverarbeitung verwendet wurden: Virtual Shared Graphics Acceleration (vSGA) und Virtual Dedicated Graphics Acceleration (vDGA). Die vGPU-Lösung kombiniert das Beste aus beiden Technologien. Wie im Fall von vSGA sollten in der vGPU-Umgebung die GPU und der RAM von mehreren virtuellen Desktops gemeinsam genutzt werden, aber jede VM überträgt Befehle direkt an die GPU, wie dies bei vDGA der Fall ist.

Warum brauche ich vGPU?


Cloud Computing mit vGPU ermöglicht es Unternehmen, Aufgaben zu bewältigen, die zuvor nicht zu lösen waren. Oder vielleicht, aber es erforderte eine unrealistische Menge an Ressourcen. 1 moderner GPU-Server kann bis zu 100 herkömmliche CPUs ersetzen. Es gibt andere, noch beeindruckendere Figuren . Dies sind keine Witze: Nvidia-Lösungen verarbeiten Petabytes an Daten um ein Vielfaches schneller als klassische CPU-Server. Dieselbe Google Cloud bietet virtuelle Maschinen mit GPUs, die bis zu 960 Teraflops ausgeben.

Viele Profis benötigen leistungsstarke Geräte, die paralleles Rechnen durchführen können. Architekten und Ingenieure verwenden die vGPU-Technologie in Entwurfssystemen (z. B. dasselbe Autodesk). Designer arbeiten mit digitalen Foto- und Videoinhalten (Photoshop, CorelDraw). Virtuelle Maschinen mit GPUs werden auch von medizinischen Einrichtungen benötigt, die Patienten- und Krankheitsdaten sammeln und analysieren. Funktioniert mit GPU und Yandex .

Alles denken? Egal wie. Die Technologie wird sowohl zur automatischen Überprüfung der Genauigkeit von Satellitenbildern als auch zur Vorhersage von Epidemien , meteorologischen Studien , Modellierung von Sonnenzyklen und Geschäftsanalysen verwendet . Es gibt auch einen coolen Artikel über das Modellieren in Unity3D von ThisIsZolden .

Für all dies sind Lösungen, die auf vGPU basieren, weltweit noch nicht weit verbreitet. Daher führte NetApp 2018 eine Umfrage unter Unternehmen durch, die GPUs für ihre Arbeit verwenden. Die Ergebnisse zeigten, dass 60% der Unternehmen immer noch an ihrer eigenen IT-Infrastruktur arbeiten. "Cloud" wird nur von 23% genutzt. In Russland ist die Verbreitung der Cloud-Computing-Technologie weniger wichtig. Dank neuer Hardware- und Softwarelösungen wächst die Anzahl der Unternehmen, die virtuelle Maschinen mit GPUs verwenden, stetig.

VGPU-Lösungen




Viele Unternehmen sind an der Entwicklung von Virtualisierungstechnologien für Grafikbeschleuniger beteiligt, aber es gibt zweifellos führende Unternehmen unter ihnen.

Als einer der angesehensten Entwickler von Cloud-Lösungen bietet VMware Unternehmen den ESXi- Hypervisor an, mit dem die Geschwindigkeit virtueller GPUs mit Bare-Metal-Implementierungen vergleichbar ist. In einem kürzlich durchgeführten Update hat der Entwickler den vMotion-Load-Balancer deaktiviert und die DirectPath-E / A-Technologie unterstützt, die den CUDA-Treiber unter Umgehung des Hypervisors mit der VM verbindet und die Datenübertragung beschleunigt.

Nvidia versucht auch, die Erwartungen des Marktes zu erfüllen, und hat dafür die OpenSource-Plattform Rapids veröffentlicht . Die Lösung kombiniert mehrere Bibliotheken für die Arbeit mit der CUDA-Architektur. Dies vereinfacht die Arbeit mit Daten während des Trainings neuronaler Netze und ermöglicht Ihnen die Automatisierung der Arbeit mit Python-Code. Die Verwendung von Rapids mit dem Algorithmus für maschinelles Lernen von XGBoost bietet eine 50-fache Leistungssteigerung gegenüber CPU-basierten Systemen.

AMD hat eine eigene Technologie. Die Plattform heißt ROCm . Es verwendet die SR-IOV-Technologie, die die Hardwarefunktionen eines physischen Geräts von mehreren virtuellen Maschinen gemeinsam nutzt. Die Ressourcen eines Beschleunigers können auf 16 Benutzer aufgeteilt werden, wobei für jeden Benutzer die gleiche Leistung erhalten bleibt. Dies beschleunigt die Datenübertragung zwischen Cloud-CPUs und GPUs. Ein spezieller C ++ - Dialekt namens HIP wird ebenfalls verwendet, der die Implementierung mathematischer Operationen auf der GPU vereinfacht.

Intel baut seine Technologie auf dem plattformübergreifenden Hypervisor Citrix XenServer 7 auf, der 2017 das FSTEC-Konformitätszertifikat erhalten hat. Die Lösung kombiniert die Arbeit eines Standard-GPU-Treibers und einer virtuellen Maschine. Das heißt, die "virtualka" kann den Betrieb schwerer Anwendungen auf Geräten einer großen (mehreren hundert) Anzahl von Benutzern unterstützen.

Marktaussichten




Unabhängige Analysten schätzen, dass der Umsatz mit HPC-Lösungen bis 2022 45 Milliarden US-Dollar erreichen wird. Plattformentwickler erwarten auch eine erhöhte Nachfrage nach Hochleistungssystemen. Diese Erwartung wird durch die Popularität von Big Data und die häufig auftretende Notwendigkeit, große Datenmengen zu verarbeiten, verstärkt.

Die gestiegene Nachfrage nach vGPUs kann auch die Entwicklung von Hybridtechnologien stimulieren, die GPUs und CPUs in einem Gerät kombinieren. In solchen integrierten Lösungen verwenden zwei Arten von Kernen einen gemeinsamen Cache, der die Datenübertragung zwischen Grafiken und herkömmlichen Prozessoren beschleunigt.

Hybrids hat den Ansatz zur Virtualisierung und Verteilung virtueller Ressourcen in Rechenzentren grundlegend geändert. Mit Open Source-Lösungen wie ROCm und Rapids können Rechenzentrumsbetreiber Rechenressourcen effizienter nutzen und so die Geräteleistung steigern.

Es gibt eine andere Meinung. Zum Beispiel werden diese virtuellen GPUs durch optische Chips mit Photonencodierung von Daten ersetzt. Solche Lösungen existieren bereits und werden für maschinelles Lernen verwendet. Darüber hinaus scheinen sie produktiver zu sein als eine normale GPU. Aber die Technologie ist immer noch feucht.

Welche Schlussfolgerung kann gezogen werden? Trotz des möglichen Auftretens von Analoga ist vGPU ein vielversprechender Bereich, der eine Vielzahl von Problemen lösen kann. Aber es passt nicht jedem. Sie können also selbst ein Komma in die Kopfzeile einfügen.

PS
Abonnieren Sie unseren Telegrammkanal , um keinen weiteren Artikel zu verpassen! Wir schreiben nicht mehr als zweimal pro Woche und nur geschäftlich.

Source: https://habr.com/ru/post/de460627/


All Articles