تحدثنا سابقًا عن أقوى حاسوب ياباني قوي للبحث في الفيزياء النووية. يتم إنشاء كمبيوتر عملاق exaflops Post-K في اليابان - سيكون اليابانيون من بين أول من أطلق آلة بهذه القوة الحاسوبية.
ومن المقرر التكليف لعام 2021.
في الأسبوع الماضي ، تحدث فوجيتسو عن الخصائص التقنية لشريحة A64FX ، والتي ستشكل أساس "الجهاز" الجديد. سنخبرك المزيد عن الرقاقة وقدراتها.
/ photo Toshihiro Matsui CC / كمبيوتر عملاق ياباني Kمواصفات A64FX
من المتوقع أن تكون إمكانات الحوسبة لما بعد K
أعلى بعشر مرات تقريبًا
من أداء أقوى أجهزة الكمبيوتر العملاقة الموجودة في
IBM Summit (
اعتبارًا من يونيو 2018 ).
يدين الكمبيوتر العملاق بأداء مماثل للرقاقة القائمة على الذراع A64FX.
تتكون هذه الشريحة من 48 نواة لعمليات الحوسبة وأربعة نوى للتحكم فيها. تنقسم كل منها بالتساوي إلى أربع مجموعات - مجموعات الذاكرة الأساسية (CMG).
تحتوي كل مجموعة على 8 ميغابايت من ذاكرة التخزين المؤقت L2. وهي متصلة بوحدة التحكم في الذاكرة وواجهة NoC ("
شبكة على شريحة "). تقوم NoC بتوصيل CMGs المختلفة مع وحدات تحكم PCIe و Tofu. هذا الأخير مسؤول عن الاتصال بين المعالج وبقية النظام. تحتوي وحدة تحكم Tofu على عشرة منافذ بسعة إنتاجية تبلغ 12.5 جيجابايت / ثانية.
تخطيط الشريحة على النحو التالي:

يبلغ إجمالي ذاكرة
HBM2 للمعالج 32 جيجابايت ،
ويصل إنتاجه إلى 1024 جيجابايت / ثانية. يقول فوجيتسو أن أداء المعالج في عمليات النقطة العائمة يصل إلى 2.7 تيرافلوب لعمليات 64 بت ، و 5.4 تيرافلوبس 32 بت و 10.8 تيرافلوبس 16 بت.
يتم مراقبة إنشاء Post-K من قبل محرري الموارد Top500 ، الذين يقومون بتجميع قائمة بأقوى أنظمة الحوسبة. وفقا لهم ، من أجل تحقيق الأداء في exaflops ، يستخدم الكمبيوتر العملاق أكثر من 370 ألف معالج A64FX.
سيستخدم الجهاز أولاً تقنية تمديد المتجهات المسماة ملحق Vector Scalable Vector Extension (SVE). وهو يختلف عن
معماريات SIMD الأخرى في أنه لا
يحد من طول سجلات المتجهات ، ولكنه يحدد نطاقًا صالحًا لها. يدعم SVE المتجهات من 128 إلى 2048 بت في الطول. لذلك يمكن تشغيل أي برنامج على معالجات أخرى تدعم SVE ، دون الحاجة إلى إعادة الترجمة.
باستخدام SVE (نظرًا لأنها وظيفة SIMD) ، يمكن للمعالج إجراء حسابات في وقت واحد مع العديد من صفائف البيانات. فيما يلي مثال لأحد هذه التعليمات الخاصة بوظيفة NEON ، والتي تم استخدامها لحوسبة المتجهات في بنيات معالج الذراع الأخرى:
vadd.i32 q1, q2, q3
يضيف أربعة أعداد صحيحة 32 بت من تسجيل 128 بت q2 مع الأرقام المقابلة في تسجيل 128 بت q3 ويكتب الصفيف الناتج إلى q1. ما يعادل هذه العملية في C يبدو كما يلي:
for(i = 0; i < 4; i++) a[i] = b[i] + c[i];
بالإضافة إلى ذلك ، يدعم SVE التوجيه التلقائي. يقوم ناقل ناقل تلقائي بتحليل الدورات في التعليمات البرمجية ، وإذا أمكن ، يستخدم تسجيلات المتجهات لتنفيذها. هذا يحسن أداء التعليمات البرمجية.
على سبيل المثال ، دالة في C:
void vectorize_this(unsigned int *a, unsigned int *b, unsigned int *c) { unsigned int i; for(i = 0; i < SIZE; i++) { a[i] = b[i] + c[i]; } }
سيتم تجميعها على النحو التالي (لمعالج ذراع 32 بت):
104cc: ldr.w r3, [r4, #4]! 104d0: ldr.w r1, [r2, #4]! 104d4: cmp r4, r5 104d6: add r3, r1 104d8: str.w r3, [r0, #4]! 104dc: bne.n 104cc <vectorize_this+0xc>
إذا كنت تستخدم التوجيه التلقائي ، فستبدو كما يلي:
10780: vld1.64 {d18-d19}, [r5 :64] 10784: adds r6, #1 10786: cmp r6, r7 10788: add.w r5, r5, #16 1078c: vld1.32 {d16-d17}, [r4] 10790: vadd.i32 q8, q8, q9 10794: add.w r4, r4, #16 10798: vst1.32 {d16-d17}, [r3] 1079c: add.w r3, r3, #16 107a0: bcc.n 10780 <vectorize_this+0x70>
هنا ، يتم تحميل تسجيلات SIMD q8 و q9 ببيانات من الصفائف المشار إليها بـ r5 و r4. بعد ذلك ، تضيف تعليمات vadd أربع قيم صحيحة 32 بت في المرة الواحدة. يؤدي هذا إلى زيادة مقدار التعليمات البرمجية ، ولكن بهذه الطريقة تتم معالجة المزيد من البيانات لكل تكرار للحلقة.
من غيره يخلق أجهزة كمبيوتر فائقة exaflops
لا يتم إنشاء أجهزة الكمبيوتر العملاقة Exaflops في اليابان فقط. على سبيل المثال ، العمل جار أيضًا في الصين والولايات المتحدة.
في الصين ، قم بإنشاء Tianhe-3 (Tianhe-3).
يجري بالفعل
اختبار نموذجها الأولي في المركز الوطني للحوسبة الفائقة في تيانجين. من المقرر أن تكتمل النسخة النهائية من الكمبيوتر في عام 2020.
/ photo O01326 CC / Tianhe-2 Supercomputer - سلف تيانهي -3في قلب Tianhe-3
توجد معالجات Phytium الصينية. يحتوي الجهاز على 64 نواة ،
ولديه أداء 512 جيجا بايت وعرض نطاق ذاكرة 204.8 جيجا بايت / ثانية.
تم أيضًا إنشاء نموذج أولي للعمل لآلة من سلسلة
Sunway . يتم اختباره في المركز الوطني للكمبيوتر العملاق في جينان. وفقًا للمطورين ، يعمل حاليًا حوالي 35 تطبيقًا على الكمبيوتر - وهي عبارة عن أجهزة محاكاة طبية حيوية ، وتطبيقات لمعالجة البيانات الضخمة ، وبرامج لدراسة تغير المناخ. من المتوقع أن يكتمل العمل على الكمبيوتر في النصف الأول من عام 2021.
أما بالنسبة للولايات المتحدة ، فإن الأمريكيين
يخططون لإنشاء حواسيبهم الخارجية بحلول عام 2021. يُطلق على المشروع اسم Aurora A21 ، ويعمل عليه
مختبر أرغون الوطني التابع لوزارة الطاقة الأمريكية ، بالإضافة إلى Intel و Cray.
هذا العام ،
اختار الباحثون بالفعل عشرة مشاريع لبرنامج Aurora Early Science Program ، الذي سيكون المشاركون فيه أول من يستخدم النظام الجديد عالي الأداء. من بينها برامج لإنشاء
خريطة للخلايا العصبية في الدماغ ، ودراسة المادة المظلمة ، وتطوير محاكي تسريع الجسيمات.
ستتيح حواسيب Exaflops إمكانية بناء نماذج معقدة للبحث ، لذلك ينتظر العديد من المشاريع العلمية إنشاء مثل هذه الآلات. أحد أكثر المشاريع طموحًا هو مشروع الدماغ البشري (HBP) ، الذي يهدف إلى إنشاء نموذج كامل للدماغ البشري ودراسة الحسابات العصبية. وفقًا لعلماء من HBP ، يمكن العثور على استخدام أنظمة exaflops الجديدة منذ الأيام الأولى لوجودها.
ما نقوم به في IT-GRAD: • IaaS • استضافة PCI DSS • Cloud -152
المحتوى من مدونة IaaS للشركات: