في فبراير ، تم عقد مؤتمر عالي الأداء للحوسبة (HPC) في ستانفورد. قال ممثلو برنامج VMware أنه عند العمل مع GPU ، فإن النظام القائم على برنامج ESXi hypervisor المعدل ليس أقل سرعة من حلول الأجهزة المعدنية.
نتحدث عن التقنيات التي سمحت بتحقيق ذلك.
/ الصورة Victorgrigas CC BY-SAقضية الأداء
وفقًا للمحللين ، يتم إجراء حوالي 70٪ من أعباء العمل في مراكز البيانات. ومع ذلك ، فإن 30 ٪ المتبقية لا تزال تعمل على المعدن العاري دون برامج مراقبة. تتكون نسبة 30٪ هذه في معظمها من التطبيقات المحملة للغاية ذات الصلة ، على سبيل المثال ، بتدريب الشبكات العصبية ، واستخدام معالجات الرسوم البيانية.
يشرح الخبراء هذا الاتجاه بحقيقة أن برنامج Hypervisor كطبقة وسيطة من التجريد يمكن أن يؤثر على أداء النظام بأكمله. في الدراسات التي أجريت منذ خمس سنوات ،
يمكنك العثور على
بيانات حول انخفاض السرعة بنسبة 10٪. لذلك ، فإن الشركات ومشغلي مركز البيانات ليسوا في عجلة من أمرهم لنقل حمولة HPC إلى بيئة افتراضية.
لكن تقنيات المحاكاة الافتراضية تتطور وتتطور. في مؤتمر قبل شهر ، قال برنامج VMware إن برنامج Hypervisor ESXi لا يؤثر سلبًا على أداء وحدة معالجة الرسومات. يمكن أن تنخفض سرعة الحوسبة بنسبة ثلاثة في المئة ، وهذا يشبه المعدن العاري.
كيف يعمل؟
لتحسين أداء أنظمة HPC باستخدام وحدات معالجة الرسومات ، قدمت VMware عددًا من التغييرات في عمل برنامج hypervisor. على وجه الخصوص ، تخلص من وظيفة vMotion. هناك حاجة لموازنة التحميل وعادة ما ينقل الأجهزة الظاهرية (VMs) بين الخوادم أو وحدات معالجة الرسومات. أدى تعطيل vMotion إلى حقيقة أن كل VM يتم الآن تعيين معالج رسومات معين. وقد ساعد ذلك في تقليل تكاليف مشاركة البيانات.
مكون رئيسي آخر للنظام
هو تقنية DirectPath I / O. يسمح برنامج تشغيل CUDA للحوسبة المتوازية بالتفاعل مباشرة مع الأجهزة الافتراضية ، متجاوزًا برنامج Hypervisor. عندما تحتاج إلى تشغيل عدة أجهزة VM على نفس وحدة معالجة الرسومات ، يتم تنشيط حل GRID vGPU. يقسم بطاقة الذاكرة إلى عدة قطاعات (ولكن لا يتم تقسيم الدورات الحسابية).
سيبدو مخطط تشغيل جهازين ظاهريين في هذه الحالة كما يلي:
النتائج والتوقعات
أجرت الشركة
اختبارات برنامج Hypervisor من
خلال تدريب نموذج اللغة على
TensorFlow . كان "الضرر" في الإنتاجية 3-4 ٪ فقط ، مقارنة مع المعدن العاري. في الوقت نفسه ، في المقابل ، كان النظام قادرا على توزيع الموارد حسب الطلب اعتمادا على الأحمال الحالية.
أجرى عملاق تكنولوجيا المعلومات
اختبارات الحاويات. قام مهندسو الشركة بتدريب الشبكات العصبية للتعرف على الصور. في الوقت نفسه ، تم توزيع موارد وحدة معالجة الرسومات (GPU) بين أربعة أجهزة VMs للحاويات. نتيجة لذلك ، انخفض أداء الأجهزة الفردية بنسبة 17٪ (مقارنةً بآلة VM واحدة تتمتع بوصول كامل إلى موارد GPU). ومع ذلك ، تضاعف عدد الصور التي
تمت معالجتها في الثانية ثلاث مرات. ومن المتوقع أن
تجد مثل هذه الأنظمة تطبيقًا في مجال تحليل البيانات ونمذجة الكمبيوتر.
من بين المشاكل المحتملة التي قد تواجهها VMware ، يفرد الخبراء جمهورًا مستهدفًا ضيقًا إلى حد ما. يعمل عدد صغير من الشركات حاليًا على أنظمة عالية الأداء. على الرغم من أن Statista
تشير إلى أنه بحلول عام 2021 ، سيتم تشغيل 94 ٪ من أعباء عمل مراكز البيانات العالمية. وفقًا للمحللين ، ستزيد قيمة سوق HPC من 32 إلى 45 مليار دولار بين عامي 2017 و 2022.
/ photo Global Access Point PDحلول مماثلة
هناك العديد من نظائرها في السوق التي تم تطويرها من قبل شركات تكنولوجيا المعلومات الكبيرة: AMD و Intel.
تقدم أول شركة افتراضية GPU منهج SR-IOV (ظاهرية إدخال / إخراج أحادية الجذر). توفر هذه التقنية إمكانية وصول VMs لبعض إمكانات الأجهزة للنظام. يتيح لك الحل تقسيم معالج الرسومات بين 16 مستخدمًا مع أنظمة افتراضية متساوية الأداء.
أما بالنسبة لعملاق تكنولوجيا المعلومات الثاني ، فإن
تقنيتها تعتمد على برنامج مراقبة Citrix XenServer 7. فهو يجمع بين عمل برنامج تشغيل GPU قياسي وجهاز افتراضي ، مما يتيح للأخير عرض التطبيقات ثلاثية الأبعاد وأجهزة سطح المكتب على أجهزة مئات المستخدمين.
تكنولوجيا المستقبل
يراهن مطورو GPU
الظاهريون على تطبيق أنظمة الذكاء الاصطناعي والشعبية المتزايدة للحلول عالية الأداء في سوق تكنولوجيا الأعمال. إنهم يأملون في أن الحاجة إلى معالجة كميات كبيرة من البيانات ستزيد الطلب على وحدات vGPU.
يبحث المصنعون الآن
عن طريقة للجمع بين وظائف وحدة المعالجة المركزية ووحدة معالجة الرسومات في جوهر واحد من أجل تسريع حل المهام المتعلقة بالرسومات ، وإجراء العمليات الحسابية الرياضية ، والعمليات المنطقية ، ومعالجة البيانات. سيؤدي ظهور مثل هذه النوى في السوق في المستقبل إلى تغيير النهج الخاص بالموارد الافتراضية وتوزيعها بين أعباء العمل في بيئة افتراضية وسحابية.
ماذا تقرأ عن الموضوع في مدونة الشركة:
بضع وظائف من قناة Telegram لدينا: