إذا كنت تقوم بتطوير قواعد بيانات كبيرة وتشغيل فجأة إلى سقف الأداء - فقد حان الوقت للتوسع. مع تمديد التدريج ، يكون الأمر واضحًا: يمكنك إضافة خوادم ولا تعرف الحزن. مع التوسع ، ليس الكثير من المرح. وفقًا للهندسة المعمارية القياسية الغلورية ، نأخذ معالجين ، ثم نضيف اثنين آخرين إليهم ... حتى نصل إلى ثمانية وهذا كل شيء. لم تتوقعها شركة Intel بعد الآن ؛ فاحفظها على خادم جديد.

ولكن هناك بديل - الهندسة المعمارية لصقها. في ذلك ، يتم ربط وحدات الحوسبة ثنائية المعالج عبر وحدات تحكم العقدة. مع مساعدتهم ، يرتفع الحد الأقصى لكل خادم إلى 16 أو أكثر من المعالجات. في هذا المنشور ، سنتحدث عن الهندسة اللاصقة بشكل عام وكيف يتم تنفيذها في خوادمنا.
قبل الانتقال إلى الهندسة اللاصقة ، من أجل الصدق ، دعونا نركز على إيجابيات وسلبيات الغراء.
الحلول المقدمة وفقا للهندسة المعمارية غلويليس نموذجية. تتواصل المعالجات مع بعضها البعض بدون جهاز إضافي ، ولكن من خلال ناقل QPI \ UPI القياسي. والنتيجة هي أرخص قليلا من مع لصقها. ولكن بعد كل ثمانية معالجات تضطر إلى إنفاق الكثير من المال - لتثبيت خادم جديد.
العمارة نموذجي غلويليسومع البنية اللاصقة ، كما قلنا بالفعل ، يزيد السقف إلى 16 أو أكثر من المعالجات لكل خادم.
كيف يعمل الهيكل الثور BCS2 الملصق
يتم توفير مزايا بنية Bull BCS2 من خلال مكونين - وحدة تحكم العقدة المرنة eXternal وذاكرة التخزين المؤقت للمعالج. يتم دعم الفرق المتوافقة مع معالجات سلسلة Intel Xeon E7-4800 / 8800 v4.
لصقها العمارة الثور BCS2. جميع الاتصالات في الخادم مرئية هنا. تحتوي كل عقدة BCS على 7 روابط XQPI.بفضل التخزين المؤقت ، يتم تقليل مقدار التفاعل بين المعالجات - يمكن للمعالجات في كل وحدة الوصول إلى ذاكرة التخزين المؤقت الشائعة. وبالتالي ، يتم تقليل الحمل على RAM. يعمل Noda ، بدوره ، كمبدل حركة مرور ويحل مشكلة "رقاب ضيقة" - يعيد توجيه حركة المرور على طول المسار الأقل استخدامًا.
نتيجة لذلك ، تستهلك بنية Bull BCS2 فقط 5-10 ٪ من عرض نطاق ناقل Intel QPI ، وهو المعيار للهندسة اللاصقة. أما بالنسبة لتأخير الوصول إلى الذاكرة المحلية ، فهي قابلة للمقارنة مع أنظمة غلويليس ذات 4 مقابس وأقل بنسبة 44٪ من أنظمة غلويليس ذات 8 مقابس. وفقًا للمواصفات ، فإن إجمالي سرعة نقل البيانات لعقدة BCS هي 230 جيجابايت / ثانية - 25.6 جيجابايت / ثانية يتم الحصول عليها لكل من المنافذ السبعة. الحد الأقصى لعرض النطاق الترددي هو 300 جيجابايت / ثانية.

في كل خادم لخادم Bullion S ، يوجد مثل هذا المفتاح على اللوحة الأم. واحد XQPI وصلة (16 مآخذ) من حيث السرعة يعادل عشرة منافذ جيجيك 10.
رينج السبائكفي التكوينات على معالجات 4 و 8 ، يكون الفرق بين الهندسة اللاصقة والهيكلية غير مهم. ومع ذلك ، يتغير الموقف عند التبديل إلى 16 معالجات. نتذكر أنه في glueless ، تحتاج بالفعل إلى خادمين لهذا الغرض. وفي خادم Bullion S ذي الهندسة اللاصقة ، كل شيء ينكسر كما يلي:
يتم ربط وحدات المعالج المزدوج عبر شبكة XQPI مع إنتاجية تبلغ 14 GT / ثانية (مليارات المعاملات في الثانية)تستوعب الفتحات أي معالج من عائلة E7 ، باستثناء E7-8893 ، والذي لا يمكن استخدامه إلا في تكوينات المعالج المزدوج. مقارنةً بالوصول إلى الذاكرة المحلية ، يصل تأخير نظام NUMA إلى حوالي x1.5 داخل الوحدة وحوالي x4 بين الوحدات. تدير وحدة التحكم المضيفة قسم الأجهزة وتتيح لك إنشاء ما يصل إلى 8 أقسام منفصلة تعمل على نظام التشغيل في خوادم Bullion S.
نتيجة لذلك ، نحن قادرون على استضافة ما يصل إلى 384 من مراكز المعالج في خادم واحد. أما بالنسبة لذاكرة الوصول العشوائي (RAM) ، فيوجد هنا 384 وحدة DDR4 بسعة 64 جيجابايت. في المجموع ، نحصل على 24 تيرابايت.
التهيئة الموصوفة مناسبة لخوادمنا - خوادم Bullion S. بالإضافة إلى ذلك ، لدينا خط BullSequana S ، والذي يمكن أن يشمل ما يصل إلى 32 معالجًا فعليًا على أساس منصة Intel Purley وهياكل Skylake و Cascadelake (Q1 2019).
أمثلة التكامل
تم تصميم Bullion S للمهام الصعبة - SAP HANA و Oracle و MS SQL و Datalake (مع شهادة Cloudera لـ BullSequana S) ، والمحاكاة الافتراضية / VDI for VMware ، والحلول فائقة التوافق القائمة على VMware vSAN. جزئيًا على خوادم Bullion S ، أنشأت Siemens أكبر منصة SAP HANA في العالم. تعتمد PWC أيضًا على Bullion S ، وقد وضعت حلاً هائلًا للتحليل والتحليل. في المجموع ، حوالي 300 شركة في العالم تستخدم حلول الثور.
من أجل تقدير قدرات خوادمنا ، سنقدم لك خطة لترحيل قاعدة بيانات Oracle من Power إلى x86 في فروع مشغل اتصالات روسي واحد:

الخاتمة
بفضل التخزين المؤقت للمعالج ، تتيح البنية الملصقة للمعالجات التواصل مباشرة مع المعالجات الأخرى في العقدة. والروابط السريعة - لا تبطئ عند التفاعل مع المجموعات الأخرى. اليوم ، يصل عدد المعالجات التي يصل عددها إلى 16 معالجًا (384 مركزًا) وما يصل إلى 24 تيرابايت من ذاكرة الوصول العشوائي إلى خادم Bullion S. الخطوة التدريجية هي معالجات اثنين - وهذا يسهل توزيع العبء المالي عند إنشاء بنية تحتية لتكنولوجيا المعلومات.
في المواد المستقبلية ، نخطط لتحليل خوادمنا بمزيد من التفاصيل. سنكون سعداء للإجابة على أسئلتك في التعليقات.