在6月至7月,将近有数十家公司对我们感兴趣,他们对虚拟GPU的功能感兴趣。 Sberbank最大的子公司之一已经在使用Cloud4Y的“图形”,但总的来说,该服务并不十分受欢迎。 因此,这种活动使我们非常高兴。 鉴于对技术的兴趣不断增长,我们决定多谈一些关于vGPU的话题。 科学实验和研究,深度学习和其他AI领域的工作,大型复杂对象的建模所获得的“数据层”-所有这些都需要高性能的硬件。 好吧,如果可以的话,可以让您快速解决当前的问题。 这仅仅是因为任务(主要用于业务分析,渲染,DL算法和框架)的计算复杂性不断提高,台式机甚至服务器CPU的硬件容量变得越来越无用。
该解决方案是在GPU计算的使用中找到的。 这种图形加速技术可在多个虚拟计算机之间共享一个GPU的资源。 GPU最初旨在与图形配合使用,因为它包含数千个用于高效处理并行任务的小核。 同时,部分最消耗资源的计算是在GPU上执行的,其余的则由CPU承担。

GPU计算是
Nvidia于2007年发明的。 今天,这项技术已达到了一个新的水平,并已在最大的企业和科学实验室的数据中心中使用。 但是,传统方法有一个明显的缺点:购买物理设备非常昂贵。 而且,如果您回想起“铁”的过时速度,它会变得更加可悲。
该问题旨在解决虚拟图形处理器的技术:vGPU。 有了它,用户可以远程启动繁重的应用程序,例如AutoCAD,3DS Max,Maya,Sony Vegas Pro。 虚拟化迅速获得了市场份额。 毕竟,哪个俄罗斯数据科学家不喜欢NVidia Tesla视频卡上的快速计算?
在这里值得注意的是,在vGPU出现之前,使用了其他图形处理加速方法:虚拟共享图形加速(vSGA)和虚拟专用图形加速(vDGA)。 vGPU解决方案结合了这两种技术的优势。 与vSGA一样,在vGPU环境中,GPU和RAM应该在多个虚拟桌面之间共享,但是每个VM都直接将命令传输到GPU,与vDGA一样。
为什么需要vGPU
使用vGPU的云计算使公司能够应对以前无法解决的任务。 或许,但是它需要不切实际的资源。 1台现代GPU服务器最多可以替代100个常规CPU。 还有其他
甚至更令人印象深刻的数字 。 这些绝不是开玩笑:Nvidia解决方案处理PB级数据的速度比传统CPU服务器快几倍。 相同的Google Cloud还为虚拟机提供了可发布高达960 teraflops的GPU的虚拟机。
许多专业人员需要可以执行并行计算的功能强大的设备。 建筑师和工程师在设计系统中使用vGPU技术(例如,相同的Autodesk)。 设计师可以处理数字照片和视频内容(Photoshop,CorelDraw)。 累积和分析患者和疾病数据的医疗机构还需要具有GPU的
虚拟机 。 与GPU和
Yandex一起使用 。
想什么? 不管如何 该技术既可用于自动
验证卫星图像的准确性,又可用于
预测流行病 ,
气象研究 ,
太阳周期建模和
业务分析 。 还有一篇很酷的
文章 ,由
ThisIsZolden 撰写的有关 Unity3D中
建模的文章 。
尽管如此,基于vGPU的解决方案尚未在世界范围内得到广泛应用。 因此,在2018年,NetApp对使用GPU的公司进行了
一项调查 。 结果表明,仍有60%的组织仍在自己的IT基础架构上工作。 只有23%的人使用“云”。 在俄罗斯,云计算技术的渗透不太重要。 但是由于有了新的硬件和软件解决方案,使用带有GPU的虚拟机的公司数量正在不断增长。
VGPU解决方案

许多公司都参与了图形加速器虚拟化技术的开发,但是其中无疑有领导者。
作为最受人尊敬的云解决方案开发商之一,
VMware为公司提供了
ESXi hypervisor,在此下,虚拟GPU的速度可与裸机实现媲美。 在最近的更新中,开发人员关闭了vMotion负载平衡器,并增加了对DirectPath I / O技术的支持,该技术绕过虚拟机管理程序将CUDA驱动程序连接到VM,并加快了数据传输速度。
Nvidia也在努力满足市场的期望,为此发布了开源平台
Rapids 。 该解决方案结合了多个用于CUDA架构的库,从而简化了神经网络训练过程中的数据处理,并允许您自动处理Python代码。 将Rapids与XGBoost机器学习算法配合使用可使性能比基于CPU的系统提高50倍。
AMD拥有自己的技术。 该平台称为
ROCm 。 它使用SR-IOV技术,该技术在多个虚拟机之间共享物理设备的硬件功能。 一个加速器的资源可以分配给16个用户,并为每个用户保持相同的性能。 这加快了云CPU和GPU之间的数据传输。 还使用一种称为HIP的特殊C ++方言,它简化了GPU上数学运算的实现。
英特尔正在基于跨平台的管理程序
Citrix XenServer 7构建其技术,该系统于2017年获得FSTEC合格证书。 该解决方案结合了标准GPU驱动程序和虚拟机的工作。 也就是说,“ virtualka”可以
支持大量(数百个)用户设备上繁重的应用程序
的运行。
市场前景

独立分析师估计,到2022年,HPC解决方案的销售额将达到450亿美元。 平台开发人员还期望对高性能系统的需求增加。 大数据的普及以及对处理大量数据的需求不断增加,使这种期望得到了加强。
此外,对vGPU的需求不断增长可以刺激将GPU和CPU集成在一个设备中的混合技术的发展。 在这样的集成解决方案中,两种类型的内核使用公共缓存,这可以加快图形处理器与传统处理器之间的数据传输速度。
混合从根本上改变了虚拟化方法以及数据中心内虚拟资源的分配。 ROCm和Rapids等开源解决方案使数据中心运营商可以更有效地使用计算资源,从而提高设备性能。
还有另一种意见。 例如,虚拟GPU将被具有数据光子编码的光学芯片取代。 这样的解决方案已经存在,并用于机器学习。 而且,它们似乎比常规GPU更具
生产力 。 但是技术仍然很潮湿。
可以得出什么结论? 尽管可能会出现类似物,但vGPU是一个很有前途的领域,可以解决许多问题。 但这并不适合所有人。 因此,您可以自己在标头中添加逗号。
聚苯乙烯订阅我们的电报频道,以免错过其他文章! 我们每周写不超过两次,并且只在商务上写。