
أعلنت شركة إنتل أمس ، 04/02/2019 ، عن التحديث الذي طال انتظاره لعائلة معالجات Intel® Xeon® القابلة للتحجيم ، والتي تم تقديمها في منتصف عام 2017. تعتمد المعالجات الجديدة على البنية الدقيقة ، والتي تحمل الاسم الرمزي Cascade Lake ، وهي مبنية على عملية محسنة تبلغ 14 نانومتر.
ميزات المعالجات الجديدة

أولاً ، إلقاء نظرة على الاختلافات في وضع العلامات. في المقالة السابقة حول Skylake-SP ، ذكرنا بالفعل أن جميع المعالجات تنقسم إلى 4 سلاسل -
البرونزية والفضية والذهبية والبلاتينية . يوضح الرقم الأول من الرقم السلسلة التي ينتمي إليها طراز المعالج:
- 3 - البرونز ،
- 4 - فضة ،
- 5 ، 6 - الذهب ،
- 8 - البلاتين.
يشير الرقم الثاني إلى توليد المعالج. بالنسبة لعائلة معالجات Intel® Xeon® القابلة للتطوير ، الأجيال التي تحمل الكود:
- 1 - سكايليك ،
- 2 - بحيرة كاسكيد.
يشير الرقمان التاليان إلى ما يسمى SKU (وحدة حفظ الأوراق المالية). في الواقع ، هذا هو مجرد معرف وحدة المعالجة المركزية مع مجموعة محددة من الوظائف المتاحة.
أيضا ، بعد رقم الطراز ، قد يكون هناك مؤشرات تدل على حرف أو حرفين. يشير الحرف الأول من الفهرس إلى ميزات البنية أو تحسين المعالج نفسه ، والثاني - سعة الذاكرة على المقبس.
على سبيل المثال ، خذ معالجًا يسمى
Intel® Xeon® 6240 . فك:
- 6 - معالج السلسلة الذهبية ،
- 2 - جيل بحيرة كاسكيد ،
- 40 - SKU.
إنتاجية
تم تصميم معالجات الجيل الجديد لاستخدامها في مجالات المحاكاة الافتراضية والذكاء الاصطناعي وكذلك الحوسبة عالية الأداء. كان أول تغيير ملحوظ هو الزيادة في تردد الساعة. كان هذا متوقعًا جدًا ، نظرًا لوجود عدد كبير من تطبيقات الخادم التي تعد سرعة الساعة فيها أكثر أهمية من عدد مراكز المعالج. على سبيل المثال ، المنتج المالي 1C ، الذي تنص متطلبات النظام بوضوح على أنه كلما زاد تردد المعالج ، كلما حصل المستخدم النهائي على النتيجة بشكل أسرع.
في بعض الحالات ، تم زيادة عدد النوى. للتوضيح ، قمنا بتجميع جداول مقارنة للعديد من معالجات عائلة معالجات Intel® Xeon® القابلة للجيل الأول والثاني:
الزيادة في تردد الساعة تؤدي حتما إلى زيادة تبديد الحرارة. بالنسبة للمعالجات الرئيسية لسلسلة Platinum ، يمكن أن تصل إلى
205 واط ، وهو اختبار خطير للغاية لنظام تبريد الهواء التقليدي. يمكن افتراض أنه في المستقبل المنظور ، ستحتاج منصات الخادم إلى تبريد سائل.
كما هو الحال في الجيل السابق من Skylake SP ، يتم تثبيت المعالجات في مقبس
LGA3647 (Socket P) ، والذي يرجع إلى استخدام وحدة تحكم ذاكرة 6 قنوات (بحد أقصى
وحدتي ذاكرة لكل قناة). تردد الذاكرة هو
2666 طن / ثانية ، ومع ذلك ، عند استخدام معالجات السلسلة 6000 و 8000 ، يمكنك استخدام الذاكرة بتردد
2933 طن / ث (لا يزيد عن وحدة واحدة لكل قناة).

ظلت حافلة
Ultra-Path Interconnect ، التي تم استخدامها بنجاح في الجيل الأول من معالجات Intel Xeon SP ، في الجيل الثاني ، حيث توفر تبادل البيانات بين المعالجات بسرعة 9.6 GT / s أو 10.4 GT / s لكل قناة. يتيح لك ذلك توسيع نطاق النظام الأساسي للأجهزة بفعالية إلى 8 معالجات فعلية ، مما يؤدي إلى تحسين عرض النطاق الترددي وكفاءة الطاقة.
اختبارات
بدأنا في اختبار معالجات الجيل الجديد بمساعدة مجموعة اختبار
SPEC ، والتي تحاكي الحمل استنادًا إلى حل مهام الحياة الأكثر إلحاحًا. تمثل هذه الاختبارات أبسط العمليات الحسابية وحساب العمليات الفيزيائية المختلفة ، على سبيل المثال ، حل مشكلات الفيزياء الجزيئية والديناميكا المائية.
حاليًا ، أعددنا نتائج بعض اختبارات SPEC للحسابات الصحيحة باستخدام معالجات Intel® Xeon® Gold 6140 و Intel® Xeon® Gold 6240 كأمثلة.
وصف الاختبار- perlbench_r هي نسخة مجردة من لغة بيرل. حمل الاختبار يقلد عمل نظام SpamAssassin الشهير لمكافحة البريد العشوائي ؛
- deepsjeng_r - محاكاة لعبة الشطرنج. يقوم الخادم بإجراء دراسة متعمقة لمواقف اللعبة باستخدام خوارزمية لقطة ألفا بيتا ؛
- leela_r - محاكاة لعبة في الذهاب. في عملية الاختبار ، هناك تحليل لأنماط الحركة ، وكذلك البحث الانتقائي في الشجرة على أساس حدود الثقة العليا ؛
- exchange2_r - مولد الألغاز سودوكو غير تافهة. مكتوب في Fortran 95 ، فإنه يستخدم معظم وظائف معالجة الصفيف.
- برنامج التحويل البرمجي gcc_s C: يُحمّل الاختبار اختبار برنامج التحويل البرمجي لدول مجلس التعاون الخليجي من أكواد المصدر الخاصة ببنية المعالج الدقيق IA-32.
وفقًا لنتائج الاختبارات ، يصبح من الواضح أن معالجات الجيل الجديد تؤدي حسابات عدد صحيح أسرع من الجيل السابق. سنشارك نتائج الاختبارات الأخرى في إحدى المقالات التالية.
دعم الذاكرة الدائمة Intel® Optane ™ DC
تسريع عبء العمل على قواعد البيانات والتطبيقات المحملة للغاية - هذا ما توقعه جميع العملاء من التحديث القادم. لذلك ، كان أحد الابتكارات الرئيسية هو دعم الذاكرة الدائمة Intel® Optane ™ DC ، والمعروفة باسم الرمز Apache Pass.

تم تصميم هذه الذاكرة لتصبح حلًا عالميًا للمشكلة عند استخدام الكمية المناسبة من DRAM غير موات اقتصاديًا ، وخصائص السرعة حتى محركات أقراص الحالة الصلبة الرئيسية ليست كافية.
مثال حي على ذلك هو وضع قواعد البيانات مباشرة في الذاكرة الدائمة Intel® Optane ™ DC ، والتي تلغي الحاجة إلى تبادل ثابت للبيانات بين ذاكرة الوصول العشوائي وجهاز تخزين (ميزة متأصلة في الأنظمة التقليدية).
يتم تثبيت نوع جديد من الذاكرة مباشرة في فتحة DIMM ومتوافق تمامًا معها. تتوفر وحدات مع وحدة التخزين التالية:
- 128 جيجابايت
- 256 جيجابايت
- 512 جيجابايت
ستتيح لك هذه الكميات الكبيرة من الوحدات النمطية تكوين نظام أساسي للأجهزة بمرونة ، بعد أن حصلت على مساحة قرص كبيرة جدًا وسريعة للغاية للأنظمة المحملة للغاية. تتمتع الذاكرة الدائمة Intel® Optane ™ DC بإمكانية هائلة للتطبيق ، بما في ذلك التعلم الآلي.
أسرع التعلم العميق
بالإضافة إلى دعم نوع جديد من الذاكرة ، اهتم مهندسو Intel بتسريع عملية التعلم العميق. نظرًا لأن الشبكات العصبية التلافيفية تتطلب غالبًا مضاعفات متعددة بقيمة 8 و 16 بت ، تلقت المعالجات الجديدة دعمًا
لتعليمات AVX-512 VNNI (تعليمات الشبكة العصبية المتجهية). سيتيح لك ذلك تحسين الحساب وتسريعه عدة مرات.
يتم تحقيق أفضل كفاءة من خلال تنفيذ مجموعة التعليمات التالية:
- VPDPBUSD (لحسابات INT8) ،
- VPDPWSSD (لإجراء حسابات INT16).
خلاصة القول هي تقليل عدد العناصر التي تمت معالجتها في كل دورة. يجمع تعليمة
VPDPWSSD بين إرشادات INT16 كما تستخدم ثابت INT32 لاستبدال الإرشادات الحالية
PMADDWD و
VPADDD .
يقلل تعليمات
VPDPUSB أيضًا عدد العناصر عن طريق استبدال الإرشادات الثلاثة الحالية
VPMADDUSBW و
VPMADDWD و
VPADDD .
وبالتالي ، مع التطبيق الصحيح لمجموعة التعليمات الجديدة ، من الممكن تقليل عدد العناصر المعالجة لكل دورة مرتين إلى ثلاث مرات وزيادة سرعة معالجة البيانات. سيصبح الإطار المناسب للتعليمات الجديدة جزءًا من مكتبات برامج التعلم الآلي الشائعة مثل:
تحميل موازنة التحسين
أصبح التحميل الموحد لموارد الحوسبة أسهل من خلال تقنية Intel® Speed Select Technology (على المعالجات ذات مؤشر Y). خلاصة القول هي أن كل عملية تبدأ في أن ترتبط بعدد النوى المعنية وسرعة الساعة. بناءً على ملف التعريف المحدد لكل عملية ، يتم تخصيص الموارد على النحو التالي:
- المزيد من النوى ، ولكن مع انخفاض سرعة الساعة.
- عدد أقل من النوى ، ولكن مع زيادة سرعة الساعة.
يتيح لك هذا الأسلوب الاستفادة الكاملة من الموارد ، وهو أمر مهم بشكل خاص عند استخدام البيئات الافتراضية. سيؤدي ذلك إلى تقليل التكاليف عن طريق تحسين الحمل على مضيفات المحاكاة الافتراضية.
تسريع الحوسبة العلمية
تتطلب معالجة البيانات العلمية ، لا سيما عند نمذجة العمليات الفيزيائية على مستوى الجسيمات (على سبيل المثال ، حساب التفاعلات الكهرومغناطيسية) قدرًا هائلاً من الحوسبة المتوازية. يمكن حل هذه المشكلة باستخدام وحدة المعالجة المركزية ، GPU أو FPGA.
وحدات المعالجة المركزية متعددة النواة عالمية بسبب العدد الكبير من أدوات البرمجيات والمكتبات لمعالجة البيانات. يعد استخدام وحدة معالجة الرسومات (GPU) لهذه الأغراض فعالًا أيضًا ، لأنه يمكنك تشغيل الآلاف من مؤشرات الترابط المتوازية مباشرة على مراكز رسومات الأجهزة. هناك أطر ملائمة للتطوير ، مثل OpenCL أو CUDA ، والتي تتيح لك إنشاء تطبيقات بأي تعقيد باستخدام
الحوسبة GPU .
ومع ذلك ، هناك أداة الأجهزة الأخرى التي تحدثنا عنها بالفعل
في المقالات السابقة - FPGA. تتيح لك القدرة على برمجة مثل هذه الأجهزة لإجراء عمليات حسابية محددة تسريع معالجة البيانات وإلغاء تحميل وحدة المعالجة المركزية جزئيًا. يمكن تنفيذ سيناريو مشابه على معالجات Cascade Lake الجديدة جنبًا إلى جنب مع Intel® Stratix® 10 SX FPGAs المنفصلة.
على الرغم من انخفاض سرعة الساعة مقارنةً بوحدات المعالجة المركزية التقليدية ، فإن FPGA قادر على إظهار الأداء أعلى بعشر مرات. بالنسبة لبعض أنواع المهام ، مثل معالجة الإشارات الرقمية ، يمكن Intel® Stratix® 10 SX عرض نتائج تصل إلى 10 TFLOPS (عمليات الفاصلة العائمة في الثانية).
توسيع منصة
ممارسة الأعمال في الوقت الحقيقي لا تعني الاستقرار فحسب ، ولكن أيضًا القدرة على التوسع حسب الطلب. ومن الأمثلة الجيدة على ذلك منصة SAP HANA عالية الأداء المستخدمة لتخزين البيانات ومعالجتها. يتطلب النشر الفعلي لهذا النظام الأساسي موارد أجهزة قوية للغاية.
تم تصميم معالجات Intel® Xeon® Scalable لتحويل الأنظمة متعددة المقابس إلى عناصر أساسية للبنية التحتية لتكنولوجيا المعلومات ، مما يوفر قابلية للتطوير لتلبية متطلبات تطبيقات الأعمال.

يتم تطبيق ذلك في شكل دعم لوحدات تحكم العقدة الخارجية ، والتي تتيح لك إنشاء تكوينات بمستوى أعلى مما يمكن أن توفره منصة واحدة. على سبيل المثال ، يمكنك إنشاء تكوين مكون من 32 معالجات فعلية من خلال دمج موارد العديد من الأنظمة الأساسية متعددة المقابس في مجموعة واحدة.
استنتاج
زيادة في ترددات التشغيل ومعالجات المعالج ، وزيادة في الإنتاجية ، ودعم الذاكرة الدائمة Intel® Optane ™ DC - كل هذه التحسينات تزيد بشكل كبير من قوة الحوسبة لكل منصة ، مما يقلل من تكلفة كمية المعدات المستخدمة ويزيد من كفاءة معالجة البيانات. يسمح لك مبدأ قابلية التوسع ، المنصوص عليه على مستوى الهندسة المعمارية ، ببناء بنية تحتية لتكنولوجيا المعلومات بأي تعقيد وتحقيق أداء عال وكفاءة في استخدام الطاقة.
نظرًا لأن Selectel شريك من إنتل بلاتينيوم ، فقد أصبح عملاؤنا
الآن على استعداد لطلب معالجات Intel® Xeon® القابلة للجيل من الجيل التالي في خوادم التكوين العشوائي.
من السهل استئجار خادم مع معالجات الجيل التالي! اذهبوا
إلى صفحة المواصفات وحدد المكونات الضرورية. يمكن توجيه أي أسئلة بخصوص تشغيل الخدمات إلى المتخصصين لدينا عن طريق
إنشاء تذكرة في لوحة التحكم. عند الدفع لخادم لعدة أشهر مقدمًا ، تحصل على خصم يصل إلى 15٪.
إذا كنت مهتمًا بالمشاركة في اختبار أحدث التقنيات ، فقم
بالانضمام إلى Selectel Lab.
سنكون سعداء لسماع أسئلتك واقتراحاتك في التعليقات.