كيفية "الغراء" خادم يستند إلى إنتل والتغلب على سقف التوسع من 8 معالجات

إذا كنت تقوم بتطوير قواعد بيانات كبيرة وتشغيل فجأة إلى سقف الأداء - فقد حان الوقت للتوسع. مع تمديد التدريج ، يكون الأمر واضحًا: يمكنك إضافة خوادم ولا تعرف الحزن. مع التوسع ، ليس الكثير من المرح. وفقًا للهندسة المعمارية القياسية الغلورية ، نأخذ معالجين ، ثم نضيف اثنين آخرين إليهم ... حتى نصل إلى ثمانية وهذا كل شيء. لم تتوقعها شركة Intel بعد الآن ؛ فاحفظها على خادم جديد.



ولكن هناك بديل - الهندسة المعمارية لصقها. في ذلك ، يتم ربط وحدات الحوسبة ثنائية المعالج عبر وحدات تحكم العقدة. مع مساعدتهم ، يرتفع الحد الأقصى لكل خادم إلى 16 أو أكثر من المعالجات. في هذا المنشور ، سنتحدث عن الهندسة اللاصقة بشكل عام وكيف يتم تنفيذها في خوادمنا.

قبل الانتقال إلى الهندسة اللاصقة ، من أجل الصدق ، دعونا نركز على إيجابيات وسلبيات الغراء.

الحلول المقدمة وفقا للهندسة المعمارية غلويليس نموذجية. تتواصل المعالجات مع بعضها البعض بدون جهاز إضافي ، ولكن من خلال ناقل QPI \ UPI القياسي. والنتيجة هي أرخص قليلا من مع لصقها. ولكن بعد كل ثمانية معالجات تضطر إلى إنفاق الكثير من المال - لتثبيت خادم جديد.


العمارة نموذجي غلويليس

ومع البنية اللاصقة ، كما قلنا بالفعل ، يزيد السقف إلى 16 أو أكثر من المعالجات لكل خادم.

كيف يعمل الهيكل الثور BCS2 الملصق


يتم توفير مزايا بنية Bull BCS2 من خلال مكونين - وحدة تحكم العقدة المرنة eXternal وذاكرة التخزين المؤقت للمعالج. يتم دعم الفرق المتوافقة مع معالجات سلسلة Intel Xeon E7-4800 / 8800 v4.


لصقها العمارة الثور BCS2. جميع الاتصالات في الخادم مرئية هنا. تحتوي كل عقدة BCS على 7 روابط XQPI.

بفضل التخزين المؤقت ، يتم تقليل مقدار التفاعل بين المعالجات - يمكن للمعالجات في كل وحدة الوصول إلى ذاكرة التخزين المؤقت الشائعة. وبالتالي ، يتم تقليل الحمل على RAM. يعمل Noda ، بدوره ، كمبدل حركة مرور ويحل مشكلة "رقاب ضيقة" - يعيد توجيه حركة المرور على طول المسار الأقل استخدامًا.

نتيجة لذلك ، تستهلك بنية Bull BCS2 فقط 5-10 ٪ من عرض نطاق ناقل Intel QPI ، وهو المعيار للهندسة اللاصقة. أما بالنسبة لتأخير الوصول إلى الذاكرة المحلية ، فهي قابلة للمقارنة مع أنظمة غلويليس ذات 4 مقابس وأقل بنسبة 44٪ من أنظمة غلويليس ذات 8 مقابس. وفقًا للمواصفات ، فإن إجمالي سرعة نقل البيانات لعقدة BCS هي 230 جيجابايت / ثانية - 25.6 جيجابايت / ثانية يتم الحصول عليها لكل من المنافذ السبعة. الحد الأقصى لعرض النطاق الترددي هو 300 جيجابايت / ثانية.



في كل خادم لخادم Bullion S ، يوجد مثل هذا المفتاح على اللوحة الأم. واحد XQPI وصلة (16 مآخذ) من حيث السرعة يعادل عشرة منافذ جيجيك 10.


رينج السبائك

في التكوينات على معالجات 4 و 8 ، يكون الفرق بين الهندسة اللاصقة والهيكلية غير مهم. ومع ذلك ، يتغير الموقف عند التبديل إلى 16 معالجات. نتذكر أنه في glueless ، تحتاج بالفعل إلى خادمين لهذا الغرض. وفي خادم Bullion S ذي الهندسة اللاصقة ، كل شيء ينكسر كما يلي:


يتم ربط وحدات المعالج المزدوج عبر شبكة XQPI مع إنتاجية تبلغ 14 GT / ثانية (مليارات المعاملات في الثانية)

تستوعب الفتحات أي معالج من عائلة E7 ، باستثناء E7-8893 ، والذي لا يمكن استخدامه إلا في تكوينات المعالج المزدوج. مقارنةً بالوصول إلى الذاكرة المحلية ، يصل تأخير نظام NUMA إلى حوالي x1.5 داخل الوحدة وحوالي x4 بين الوحدات. تدير وحدة التحكم المضيفة قسم الأجهزة وتتيح لك إنشاء ما يصل إلى 8 أقسام منفصلة تعمل على نظام التشغيل في خوادم Bullion S.

نتيجة لذلك ، نحن قادرون على استضافة ما يصل إلى 384 من مراكز المعالج في خادم واحد. أما بالنسبة لذاكرة الوصول العشوائي (RAM) ، فيوجد هنا 384 وحدة DDR4 بسعة 64 جيجابايت. في المجموع ، نحصل على 24 تيرابايت.

التهيئة الموصوفة مناسبة لخوادمنا - خوادم Bullion S. بالإضافة إلى ذلك ، لدينا خط BullSequana S ، والذي يمكن أن يشمل ما يصل إلى 32 معالجًا فعليًا على أساس منصة Intel Purley وهياكل Skylake و Cascadelake (Q1 2019).

أمثلة التكامل


تم تصميم Bullion S للمهام الصعبة - SAP HANA و Oracle و MS SQL و Datalake (مع شهادة Cloudera لـ BullSequana S) ، والمحاكاة الافتراضية / VDI for VMware ، والحلول فائقة التوافق القائمة على VMware vSAN. جزئيًا على خوادم Bullion S ، أنشأت Siemens أكبر منصة SAP HANA في العالم. تعتمد PWC أيضًا على Bullion S ، وقد وضعت حلاً هائلًا للتحليل والتحليل. في المجموع ، حوالي 300 شركة في العالم تستخدم حلول الثور.

من أجل تقدير قدرات خوادمنا ، سنقدم لك خطة لترحيل قاعدة بيانات Oracle من Power إلى x86 في فروع مشغل اتصالات روسي واحد:



الخاتمة


بفضل التخزين المؤقت للمعالج ، تتيح البنية الملصقة للمعالجات التواصل مباشرة مع المعالجات الأخرى في العقدة. والروابط السريعة - لا تبطئ عند التفاعل مع المجموعات الأخرى. اليوم ، يصل عدد المعالجات التي يصل عددها إلى 16 معالجًا (384 مركزًا) وما يصل إلى 24 تيرابايت من ذاكرة الوصول العشوائي إلى خادم Bullion S. الخطوة التدريجية هي معالجات اثنين - وهذا يسهل توزيع العبء المالي عند إنشاء بنية تحتية لتكنولوجيا المعلومات.

في المواد المستقبلية ، نخطط لتحليل خوادمنا بمزيد من التفاصيل. سنكون سعداء للإجابة على أسئلتك في التعليقات.

Source: https://habr.com/ru/post/ar432832/


All Articles