Pada bulan Februari, konferensi komputasi kinerja tinggi (HPC) diadakan di Stanford. Perwakilan dari VMware mengatakan bahwa ketika bekerja dengan GPU, sistem yang didasarkan pada hypervisor ESXi yang dimodifikasi tidak kalah dalam kecepatan untuk solusi logam kosong.
Kami berbicara tentang teknologi yang memungkinkan ini dicapai.
/ foto Victorgrigas CC BY-SAMasalah kinerja
Menurut analis, sekitar 70% dari beban kerja di pusat data
divirtualisasi . Namun, 30% sisanya masih bekerja pada logam telanjang tanpa hypervisor. Ini 30% untuk sebagian besar terdiri dari aplikasi yang dimuat sangat terkait, misalnya, untuk pelatihan jaringan saraf, dan menggunakan prosesor grafis.
Para ahli menjelaskan tren ini dengan fakta bahwa hypervisor sebagai lapisan menengah abstraksi dapat mempengaruhi kinerja seluruh sistem. Dalam studi lima tahun lalu,
Anda dapat menemukan data penurunan kecepatan sebesar 10%. Oleh karena itu, perusahaan dan operator pusat data tidak terburu-buru untuk mentransfer beban HPC ke lingkungan virtual.
Tetapi teknologi virtualisasi berkembang dan membaik. Pada sebuah konferensi sebulan yang lalu, VMware mengatakan bahwa hypervisor ESXi tidak mempengaruhi kinerja GPU. Kecepatan komputasi dapat turun tiga persen, dan ini sebanding dengan logam biasa.
Bagaimana cara kerjanya
Untuk meningkatkan kinerja sistem HPC dengan GPU, VMware memperkenalkan sejumlah perubahan pada kerja hypervisor. Secara khusus, dia menyingkirkan fungsi vMotion. Ini diperlukan untuk menyeimbangkan beban dan biasanya mentransfer mesin virtual (VM) antara server atau GPU. Menonaktifkan vMotion telah mengarah pada fakta bahwa setiap VM sekarang diberi prosesor grafis tertentu. Ini telah membantu mengurangi biaya berbagi data.
Komponen kunci lain dari sistem
adalah teknologi DirectPath I / O. Ini memungkinkan driver CUDA untuk komputasi paralel untuk berinteraksi langsung dengan mesin virtual, melewati hypervisor. Ketika Anda perlu menjalankan beberapa VM pada GPU yang sama, solusi GRID vGPU diaktifkan. Ini membagi kartu memori menjadi beberapa segmen (tetapi siklus komputasi tidak dibagi).
Skema operasi dua mesin virtual dalam hal ini akan terlihat sebagai berikut:
Hasil dan perkiraan
Perusahaan
melakukan tes hypervisor
dengan melatih model bahasa berdasarkan
TensorFlow . "Kerusakan" terhadap produktivitas hanya 3-4%, dibandingkan dengan logam biasa. Pada saat yang sama, sebagai imbalannya, sistem dapat mendistribusikan sumber daya sesuai permintaan tergantung pada beban saat ini.
Raksasa IT itu juga
melakukan uji kontainer. Insinyur perusahaan melatih jaringan saraf untuk mengenali gambar. Pada saat yang sama, sumber daya dari satu GPU didistribusikan antara empat VM kontainer. Akibatnya, kinerja masing-masing mesin menurun sebesar 17% (dibandingkan dengan VM tunggal yang memiliki akses penuh ke sumber daya GPU). Namun, jumlah gambar yang diproses per detik
telah tiga kali lipat. Diharapkan sistem seperti itu
akan menemukan aplikasi di bidang analisis data dan pemodelan komputer.
Di antara potensi masalah yang mungkin dihadapi oleh VMware, para ahli memilih audiens target yang agak sempit. Sejumlah kecil perusahaan saat ini bekerja dengan sistem berkinerja tinggi. Meskipun Statista
mencatat bahwa pada tahun 2021, 94% dari beban kerja pusat data dunia akan divirtualisasi. Menurut analis, nilai pasar HPC akan tumbuh dari $ 32 menjadi $ 45 miliar antara 2017 dan 2022.
/ foto Titik Akses Global PDSolusi serupa
Ada beberapa analog di pasaran yang dikembangkan oleh perusahaan IT besar: AMD dan Intel.
Perusahaan virtualisasi GPU pertama
menawarkan pendekatan SR-IOV (single-root input / output virtualization). Teknologi ini memberikan akses VM ke beberapa kemampuan perangkat keras sistem. Solusi ini memungkinkan Anda untuk membagi prosesor grafis antara 16 pengguna dengan sistem tervirtualisasi kinerja yang sama.
Adapun raksasa IT kedua,
teknologi mereka
didasarkan pada Citrix XenServer 7. Hypervisor.Ini menggabungkan karya driver GPU standar dan mesin virtual, yang memungkinkan yang terakhir untuk menampilkan aplikasi 3D dan desktop pada perangkat ratusan pengguna.
Teknologi masa depan
Pengembang GPU virtual
bertaruh pada implementasi sistem AI dan semakin populernya solusi kinerja tinggi di pasar teknologi bisnis. Mereka berharap bahwa kebutuhan untuk memproses data dalam jumlah besar akan meningkatkan permintaan vGPU.
Sekarang produsen
mencari cara untuk menggabungkan fungsi CPU dan GPU dalam satu inti untuk mempercepat solusi tugas yang berkaitan dengan grafik, melakukan perhitungan matematika, operasi logis, dan pemrosesan data. Penampilan di pasar core seperti itu di masa depan akan mengubah pendekatan virtualisasi sumber daya dan distribusi mereka antara beban kerja di lingkungan virtual dan cloud.
Apa yang harus dibaca tentang topik di blog perusahaan kami:
Beberapa posting dari saluran Telegram kami: