تم نشر تصنيف Top500 للكمبيوتر العملاق في يونيو 2016 ، وقد أدخلت الصين 100 حاسوب عملاق PFlops

اليوم تم إصدار تصنيف 47 للحاسوب العملاق Top500 في العالم وفقًا لاختبار Linpack. على عكس الإصدارات الستة السابقة من التصنيف ، تغير زعيم القائمة ، وجاء الكمبيوتر العملاق الصيني Sunway TaihuLight (神威 · 太湖 之 光) بنتيجة 93 بيتافلوب في اختبار Linpack (الأداء النظري 125.4 بيتافلوب). أداءها أعلى بثلاث مرات تقريبًا من أداء الزعيم السابق في القائمة ، Tianhe-2 الصينية .

صورة Sunway TaihuLight.  جاك دونغارا ، تقرير عن نظام Sunway Taihu Light ، يونيو 2016

تم تطوير الكمبيوتر العملاق الجديد من قبل مركز البحوث الوطني لهندسة الحاسبات المتوازية والتكنولوجيا في الصين (المركز القومي للبحوث لهندسة الحاسبات المتوازية والتكنولوجيا). يقع النظام في المركز الوطني للحواسيب الفائقة في مقاطعة وشىجيانغسو في شرق الصين.

الصورة

يعتمد الكمبيوتر العملاق على معالجات عائلة ShenWei الصينية الجديدة - SW26010 مع بنية RISC 64 بت الأصلية ، التي يفترض أنها مصنوعة باستخدام تقنية 28 نانومتر. تم تجهيز كل معالج بـ 260 نواة ، يعمل بتردد 1.45 جيجا هرتز ولديه أداء 3.06 تيرافلوب.

تم تطوير المعالج في Shanghai High Performance IC Design Center. يتكون المعالج من 4 كتل أساسية مماثلة ، متصلة بشبكة متكاملة على رقاقة. تحتوي كل كتلة على قلب تحكم واحد (عنصر معالجة الإدارة ، MPE) ، ووحدة تحكم في ذاكرة DDR3 (128 بت) و 64 نواة معالجة (عناصر معالجة الحوسبة ، CPE) في صفيف 8x8. يحتوي كلا النوعين من النوى على بنية مصغرة مع تنفيذ استثنائي للأوامر. تدعم نواة Control MPE تنفيذ كل من نظام التشغيل ورمز المستخدم ، واستخدام عمليات المتجه 264 بت ، وتحتوي على 32 كيلوبايت من ذاكرة التخزين المؤقت في المستوى الأول من التعليمات والبيانات ، و 256 كيلوبايت من ذاكرة التخزين المؤقت في المستوى الثاني. لا يمكن لحوسبة CPE تنفيذ رمز المستخدم إلا باستخدام متجهات 264 بت ؛ فهي تستخدم 16 كيلوبايت من ذاكرة التخزين المؤقت للتعليمات و 64 كيلوبايت من الذاكرة المؤقتة ( Memory Pad Memory Memory ). يمكن لكل كتلة من الكتل الأساسية الأربعة الوصول إلى 8 غيغابايت من ذاكرة الوصول العشوائي DDR3-2133 ، وبالتالي فإن العقدة لديها 32 غيغابايت من ذاكرة الوصول العشوائي مع إجمالي عرض النطاق الترددي يصل إلى 136.5 غيغابايت / ثانية.

أداء الحوسبة SIMD على نوى MPE هو 16 عملية عائمة مزدوجة الدقة (64 بت) لكل دورة ، على نوى CPE - 8 عمليات لكل دورة. يمكن أن يصل الأداء الكلي لأنوية MPE بتردد 1.45 جيجا هرتز إلى 23.2 جيجا بايت ، ونوى CPE - 11.6 جيجا فلوب.

في المجمل ، يستخدم الكمبيوتر العملاق أكثر من 10.6 مليون نواة تتكون من 40960 عقدة أحادية المعالج في 40 رفوف حوسبة. يحتوي كل رف على 4 عقد فائقة ؛ وتتكون العقدة الفائقة من 32 وحدة من 8 عقد لكل منها. يتم تبريد الوحدات بالمياه. هناك القليل من التفاصيل حول الشبكة الرئيسية للكمبيوتر العملاق ، من المعروف أن كل شريحة SW26010 لديها اتصال PCI Express 3 (16x) بشبكة "Sunway Network" ثلاثية المستويات. قطر الشبكة - 7 ، "عرض النطاق الترددي" - 70 تيرابايت / ثانية. يقول Dongarra أنه يتم استخدام محولات القناة المضيفة ومفاتيح تبديل الشركةMellanox ، مع عرض نطاق ترددي للقناة يبلغ حوالي 12 جيجابايت / ثانية (100 جيجابت / ثانية) وتأخيرات في الترتيب من 1 ميكرو ثانية.

كانت الكفاءة الحسابية في اختبار HPL (Linpack) 74٪ من الأداء النظري. في نفس الوقت ، في اختبار HPCG أكثر تعقيدًا ، أظهر النظام 0.3 ٪ فقط من مستوى الذروة ( تصل بعض الأنظمة إلى 1-3 ٪) ، مما يشير إلى ذاكرة بطيئة نسبيًا ونطاق ترددي غير كافٍ للشبكة. بالنسبة إلى SW26010 ، تبلغ نسبة ذروة التقليب إلى عرض النطاق الترددي للذاكرة 22.4 تقليب / بايت (للمقارنة ، يحتوي Intel Knights Landing على 7.2 تقليب / بايت). أشار Dongarra أيضًا إلى أن النظام يحتوي على ذاكرة وصول عشوائي قليلة نسبيًا ، فقط 1.3 PB (Tianhe-2 لديه 1.4 PB ، Titan الأمريكي، والتي تحتل بالفعل المركز الثالث في Top500 - 0.71 PB).

كان متوسط ​​استهلاك الطاقة للكمبيوتر العملاق خلال اختبار HPL 15.3 ميجاوات (وهو أقل بقليل من 17 ميجاوات في Tianhe-2) ، الحد الأقصى - أقل بقليل من 18 ميجاوات. وفقًا لـ Dongarra ، كانت كفاءة الطاقة 6 جيجا فلوب لكل واط (مع مراعاة استهلاك المعالج والذاكرة والشبكة). احتل الحاسوب العملاق الجديد المركز الثالث في تصنيف green500.org (أكثر كفاءة في استهلاك الطاقة هي RIKEN Shoubu مع 6.6 gflops / W و RIKEN Satsuki مع 6.2 gflops / W).

يعتمد نظام تشغيل الكمبيوتر العملاق ، Sunway Raise OS 2.0.5 ، على Linux. يتوفر للمستخدمين C / C ++ ، ومجمعي فورتران ، والمرافق التلقائية للتوجيه ، ومكتبات الرياضيات. تقدم الأداة المساعدة Sunway OpenACC دعمًا لمعيار OpenACC 2.0 لتبسيط برمجة المعالجات متعددة النواة.

تبلغ تكلفة انشاء حاسوب عملاق 1.8 مليار يوان ، حوالى 270 مليون دولار امريكى.

يتوفر في مؤسس التصنيف المادة العملاق معظم المعلومات التفصيلية جاك دونغارا : جاك دونغارا، تقرير عن صنواي نظام TaihuLight يونيو عام 2016، http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016. pdf؛ الرسوم التوضيحية من مقالة "حاسوب Sunway Taihu Light Supercomputer: System and Applications" ، بقلم Fu HH ، Liao JF ، Yang JZ ، وآخرون ، مقبولة للنشر في Sci. الصين Inf. علوم ، 2016 ، 59 (7): 072001 ، دوى: 10.1007 / s11432-016-5588-7.
تم أيضًا نشر عدة شرائح من عرض جوائز TOP500 و Green500 في ISC 2016 :

الصورة

Source: https://habr.com/ru/post/ar395203/


All Articles