تقنيات إدارة الطلب على المياه: دمج مراكز البيانات في مجموعات مقاومة للكوارث

على الرغم من موثوقية مراكز البيانات الحديثة ، هناك حاجة إلى مستوى بالغ الأهمية من التكرار للمرافق الحرجة ، لأن البنية التحتية الكاملة لتكنولوجيا المعلومات قد تفشل بسبب كارثة من صنع الإنسان أو كارثة طبيعية. لضمان تحمل الكوارث ، من الضروري بناء مراكز بيانات احتياطية. تحت القص ، قصتنا حول المشاكل الناشئة عن مزيجها (DCI - ربط مركز البيانات).




نمت أحجام البيانات التي تعالجها البشرية إلى كميات لا تصدق ، ودور البنية التحتية لتكنولوجيا المعلومات في العمليات التجارية كبير جدًا لدرجة أن الفشل قصير المدى يمكن أن يشل الشركة تمامًا. يتم إدخال التقنيات الرقمية في كل مكان ، ويعتمد عليها بشكل خاص القطاع المالي أو الاتصالات أو ، على سبيل المثال ، البيع بالتجزئة الكبيرة عبر الإنترنت. إن موثوقية مراكز البيانات ليست كافية لمزود سحابي كبير أو بنك أو مشغل اتصالات كبير: يمكن حساب الخسائر الناجمة عن فترة تعطل صغيرة بمبالغ فلكية ، ولتجنبها ، هناك حاجة إلى بنية تحتية مقاومة للكوارث. يمكنك إنشائه فقط عن طريق زيادة التكرار - عليك بناء مراكز بيانات احتياطية.

فصل التوفر العالي عن التعافي من الكوارث


يمكن الجمع بين مراكز البيانات أو المعدات المركبة في المباني المستأجرة. يتم تحقيق التسامح مع الأخطاء في الحلول الموزعة جغرافيًا من خلال بنية البرمجيات ، ويمكن للمالكين التوفير في مرافقهم الخاصة: ليس عليهم بناء مركز بيانات ، على سبيل المثال ، المستوى الثالث أو حتى المستوى الثاني. يمكنك التخلي عن مولدات الديزل ، واستخدام خوادم ذات إطار مفتوح ، واللعب في ظروف درجات الحرارة القصوى والقيام بحيل أخرى مثيرة للاهتمام. هناك درجات أقل من الحرية في المناطق المستأجرة ، وهنا يحدد المزود قواعد اللعبة ، ولكن مبادئ التوحيد هي نفسها. قبل الحديث عن خدمات تكنولوجيا المعلومات المقاومة للكوارث ، تجدر الإشارة إلى ثلاثة اختصارات سحرية: RTO و RPO و RCO. تحدد مؤشرات الأداء الرئيسية هذه قدرة البنية التحتية لتكنولوجيا المعلومات على تحمل الاضطراب.

RTO (هدف وقت الاسترداد) - الوقت المسموح به لاسترداد نظام تكنولوجيا المعلومات بعد وقوع حادث ؛
RPO (هدف نقطة الاسترداد) - فقدان البيانات مقبول أثناء استعادة البيانات بعد الكوارث. وعادة ما يتم قياسها على أنها الفترة القصوى التي يمكن أن تفقد خلالها البيانات ؛
RCO (هدف سعة الاسترداد) هو جزء من حمل تكنولوجيا المعلومات الذي يمكن أن يتحمله نظام النسخ الاحتياطي. يمكن قياس المؤشر الأخير بالنسب المئوية والمعاملات و "الببغاوات" الأخرى.

من المهم التمييز بين حلول التوفر العالي (HA) واستعادة القدرة على العمل بعد الكوارث (DR). يمكن تصور الفرق بينهما في شكل رسم بياني مع RPO و RTO كمحور تنسيق:


من الناحية المثالية ، نحن لا نفقد البيانات ولا نضيع الوقت في التعافي من الفشل ، وسيضمن موقع النسخ الاحتياطي الوظائف الكاملة للخدمات ، حتى إذا تم تدمير الخدمة الرئيسية. لا يمكن تحقيق Zero RTO و RPO إلا من خلال التشغيل المتزامن لمراكز البيانات: في الواقع ، إنها مجموعة موزعة جغرافيًا وآمنة من الفشل مع نسخ البيانات في الوقت الفعلي وأفراح أخرى. في الوضع غير المتزامن ، لم يعد ضمان سلامة البيانات مضمونًا: نظرًا لأن النسخ المتماثل يتم على فترات منتظمة ، فقد يتم فقد بعض المعلومات. الوقت للتبديل إلى موقع النسخ الاحتياطي في هذه الحالة هو من عدة دقائق إلى عدة ساعات ، عندما يتعلق الأمر بما يسمى احتياطي بارد ، عندما يتم إيقاف تشغيل معظم معدات النسخ الاحتياطي ولا تستهلك الكهرباء.


التفاصيل الفنية


تنقسم الصعوبات التقنية التي تنشأ عند دمج مركزي بيانات أو أكثر إلى ثلاث فئات: التأخير في نقل البيانات ، وعدم كفاية عرض النطاق الترددي لقنوات الاتصال ، ومشاكل أمن المعلومات. عادة ما يتم توفير الاتصال بين مراكز البيانات من خلال خطوط اتصالات الألياف الضوئية الخاصة بهم أو المستأجرة ، لذلك سنتحدث عنها لاحقًا. بالنسبة إلى DPCs التي تعمل في الوضع المتزامن ، فإن المشكلة الرئيسية هي التأخير. لضمان النسخ المتماثل للبيانات في الوقت الفعلي ، يجب ألا تتجاوز 20 مللي ثانية ، وأحيانًا 10 مللي ثانية - يعتمد ذلك على نوع التطبيق أو الخدمة.

خلاف ذلك ، على سبيل المثال ، لن تعمل عائلة بروتوكولات القناة الليفية ، والتي يكاد يكون من المستحيل الاستغناء عنها في أنظمة التخزين الحديثة. هناك ، كلما زادت السرعة ، قل التأخير. هناك ، بالطبع ، بروتوكولات تسمح لك بالعمل مع شبكات التخزين عبر إيثرنت ، ولكن هنا يعتمد الكثير على التطبيقات والمعدات المركبة المستخدمة في مركز البيانات. فيما يلي أمثلة لمتطلبات الكمون لتطبيقات Oracle و VMware الشائعة:

متطلبات تأخير كتلة نظام أوراكل الموسعة:


من بيانات Oracle الرسمية: كيفية معرفة ما إذا كان الإدخال / الإخراج لقاعدة البيانات بطيئًا [ID 1275596.1]

متطلبات تأخير برنامج VMware:


دراسة حالة مجموعة التخزين VMware vSphere Metro Metro (VMware vSphere 5.0)


عند إرسال البيانات ، يمكن تمثيل تأخير الإشارة في شكل مكونين: إجمالي T = T تجهيز. + T s حيث T equ. - التأخير الناجم عن مرور الإشارة عبر الجهاز و T s - التأخير الناجم عن مرور الإشارة عبر الألياف الضوئية. يعتمد التأخير الناتج عن مرور الإشارة عبر المعدات (معدات T) على بنية المعدات وطريقة تغليف البيانات أثناء تحويل الإشارة الكهروضوئية. في معدات DWDM ، يتم تعيين هذه الوظيفة إلى وحدات الإرسال والاستقبال. لذلك ، عند تنظيم الاتصال بين مركزي البيانات ، فإنهم حريصون بشكل خاص في اختيار نوع جهاز الإرسال والاستقبال (muxponder) بحيث يكون التأخير على جهاز الإرسال (muxponder) هو الأصغر.

في الوضع المتزامن ، تلعب سرعة انتشار الإشارة في الألياف الضوئية (T s ) دورًا مهمًا. من المعروف أن سرعة انتشار الضوء في الألياف الضوئية القياسية (على سبيل المثال ، G.652) تعتمد على مؤشر الانكسار في قلبها وتساوي تقريبًا 70٪ من سرعة الضوء في الفراغ (~ 300000 كم / ثانية). لن نتعمق في الأساسيات المادية ، ولكن من السهل حساب أن التأخير في هذه الحالة يبلغ حوالي 5 ميكروثانية لكل كيلومتر. لذلك ، يمكن تشغيل مركزي بيانات بشكل متزامن على مسافة حوالي ١٠٠ كيلومتر فقط.

في الوضع غير المتزامن ، فإن متطلبات التأخير ليست صارمة للغاية ، ولكن إذا زادت المسافة بين الأجسام بشكل كبير ، فإن توهين الإشارة الضوئية في الألياف يبدأ في التأثير. يجب تضخيم الإشارة وإعادة توليدها ، أي أنه يجب عليك إنشاء نظام الإرسال الخاص بك أو استئجار قنوات اتصال جذع. أحجام حركة المرور التي تمر بين مركزي البيانات كبيرة جدًا وتميل إلى النمو باستمرار. المحركات الرئيسية لنمو حركة المرور بين مراكز البيانات: الافتراضية ، والخدمات السحابية ، والترحيل ، والاتصال بالخوادم وأنظمة التخزين الجديدة. هنا قد تواجه مشكلة عدم كفاية عرض النطاق الترددي لقنوات نقل البيانات. إن زيادتها إلى ما لا نهاية لن تعمل بسبب عدم وجود الألياف المجانية الخاصة بها أو ارتفاع تكلفة الإيجار. تتعلق النقطة الأخيرة المهمة بأمن المعلومات: يجب تشفير البيانات التي تعمل بين مراكز البيانات ، مما يزيد أيضًا من التأخيرات. هناك نقاط أخرى ، مثل تعقيد إدارة النظام الموزع ، ولكن تأثيرها ليس كبيرًا ، وجميع العوائق الفنية تتعلق بشكل أساسي بميزات قنوات الاتصال والمعدات الطرفية.

اثنان أو ثلاثة من الصعوبات الاقتصادية


كلا وضعي الجمع بين مراكز البيانات لهما عيوب كبيرة. يجب أن تكون الأجسام التي تعمل بشكل متزامن قريبة من بعضها البعض ، والتي لا تضمن بقاء واحد على الأقل منها في حالة وقوع كارثة واسعة النطاق. نعم ، هذا الخيار محمي بشكل موثوق من الخطأ البشري ، من الحريق ، من تدمير غرفة المحرك نتيجة لحادث طائرة أو من حالة طوارئ محلية أخرى ، لكنه بعيد عن حقيقة أن مركزي البيانات يمكنهما تحمل ، على سبيل المثال ، زلزال كارثي. في الوضع غير المتزامن ، يمكن تباعد الكائنات على بعد آلاف الكيلومترات ، ولكن ضمان فشل قيم RTO و RPO المقبولة. سيكون الحل المثالي هو وجود دائرة بها ثلاثة مراكز بيانات ، يعمل اثنان منها بشكل متزامن ، والثالث يقع بعيدًا عنها قدر الإمكان ويلعب دور احتياطي غير متزامن.



المشكلة الوحيدة مع مراكز البيانات الثلاثة هي التكلفة العالية للغاية. تنظيم موقع واحد احتياطي ليس رخيصًا ، وقليلًا ما يستطيع تحمل الاحتفاظ بمركزين للبيانات الخاملة. يتم استخدام نهج مماثل في بعض الأحيان في القطاع المالي إذا كانت تكلفة المعاملة عالية جدًا: يمكن أن تبدأ بورصة كبيرة خطة مع ثلاثة مراكز بيانات صغيرة ، ولكن في القطاع المصرفي يفضلون استخدام مزيج متزامن من الاثنين. عادة ما تجمع الصناعات الأخرى بين مركزي بيانات يعملان في وضع متزامن أو غير متزامن.

DWDM - الحل الأمثل ل DCI


إذا احتاج العميل إلى الجمع بين مركزي البيانات ، فسيواجه حتمًا المشاكل المذكورة أعلاه. لحلها ، نستخدم تقنية تعدد الإرسال الطيفي DWDM ، والتي تسمح بمضاعفة عدد من الإشارات الحاملة في ليف بصري واحد باستخدام أطوال موجية مختلفة (λ ، أي لامدا). علاوة على ذلك ، في زوج بصري واحد يمكن أن يكون هناك ما يصل إلى 80 (96) طولًا موجيًا وفقًا لشبكة التردد ITU-T G.694.1. معدل نقل البيانات لكل طول موجي هو 100 جيجابت / ثانية ، 200 جيجابت / ثانية أو 400 جيجابت / ثانية ، وقد تصل سعة زوج بصري واحد إلى 80 λ * 400 جيجابت / ثانية = 32 تيرابت / ثانية. هناك بالفعل تصميمات جاهزة توفر 1 تيرابت / ثانية لكل طول موجة: ستعطي عرض نطاق ترددي أكبر في المستقبل القريب. اليوم ، يحل مشكلة عرض النطاق الترددي للقناة تمامًا: بدلاً من الألياف الإضافية ، سيستخدم العميل تلك المتاحة بكفاءة أكبر - سيصل استخدام حركة المرور إلى قيم رائعة.



يسمح لك الإرسال المتعدد الطيفي بحل مشاكل عرض النطاق الترددي ، وهذا يكفي تمامًا لمراكز البيانات التي تعمل في وضع متزامن ، لأن التأخير في إرسال البيانات بينها صغير بسبب المسافة الصغيرة ويعتمد بشكل أكبر على نوع جهاز الإرسال والاستقبال (أو muxponder) المستخدم في نظام DWDM. تجدر الإشارة إلى واحدة من السمات الرئيسية لتكنولوجيا الضغط الطيفي DWDM: انتقال حركة المرور بالكامل بسبب حقيقة أن التكنولوجيا تعمل في المستوى المادي الأول من نموذج OSI ذي المستويات السبعة. إذا جاز لي أن أقول ذلك ، فإن نظام DWDM "شفاف" لاتصالات العملاء الخاصة به ، كما لو كان متصلاً بسلك التصحيح المباشر. إذا تحدثنا عن الوضع غير المتزامن ، فإن مقدار التأخير الرئيسي يعتمد على المسافة بين مراكز البيانات (نتذكر أنه في OB هناك تأخير 5 ميكروثانية لكل كيلومتر) ، ولكن لا توجد متطلبات صارمة للتأخير. لذلك ، يتم تحديد نطاق الإرسال من خلال إمكانات نظام DWDM وهو محدود بثلاثة عوامل: توهين الإشارة ، ونسبة الإشارة إلى الضوضاء ، وتشتت الضوء في وضع الاستقطاب.

عند حساب الجزء البصري من خط DWDM ، يتم أخذ جميع هذه العوامل في الاعتبار وبناءً على الحسابات ، يتم تحديد أنواع أجهزة الإرسال والاستقبال (أو أجهزة الإرسال العكسي) والعدد المطلوب ونوع مكبرات الصوت ، بالإضافة إلى المكونات الأخرى للمسار البصري. مع تطور أنظمة DWDM وظهور أجهزة الإرسال والاستقبال التي تدعم الاستقبال المتماسك بسرعات 40 جيجابت / ثانية و 100 جيجابت / ثانية وأعلى ، توقف التشتت في وضع الاستقطاب كعامل مقيد كعامل محدد. إن مسألة حساب الخط البصري واختيار نوع مكبر الصوت هو موضوع منفصل كبير يتطلب من القارئ معرفة أساسيات البصريات الفيزيائية ، ولن نناقشه بالتفصيل في هذه المقالة.

يمكن لتقنية إدارة الطلب على المياه حل مشاكل أمن المعلومات. بالطبع ، لا يجب إجراء التشفير على المستوى البصري ، ولكن هذا النهج له عدد من المزايا التي لا يمكن إنكارها. غالبًا ما يتطلب التشفير على مستويات أعلى أجهزة مستقلة لتدفقات حركة المرور المختلفة ويساهم في حدوث تأخيرات كبيرة. مع زيادة عدد هذه الأجهزة ، يزداد التأخير أيضًا ، كما يزداد تعقيد إدارة الشبكة. لا يعتمد التشفير البصري OTN (G.709 - توصية ITU-T التي تصف تنسيق الإطار في أنظمة DWDM) على نوع الخدمة ، ولا يتطلب أجهزة منفصلة وهو سريع جدًا - لا يتجاوز الفرق بين تدفق البيانات المشفرة وغير المشفرة 10 مللي ثانية.



بدون استخدام تقنية DWDM لتعدد الإرسال الطيفي ، يكاد يكون من المستحيل الجمع بين مراكز البيانات الكبيرة وإنشاء مجموعة موزعة مقاومة للكوارث. تتزايد أحجام المعلومات المرسلة عبر الشبكة بشكل كبير ، وسوف يتم استنفاد إمكانيات خطوط اتصالات الألياف الضوئية الحالية عاجلاً أم آجلاً. سيكلف وضع أو تأجير معدات إضافية العميل أكثر بكثير من شراء المعدات ، في الواقع ، اليوم ، الختم هو الخيار الوحيد المجدي اقتصاديًا. على مسافات قصيرة ، تتيح تقنيات DWDM استخدام الألياف الضوئية الموجودة بكفاءة أكبر ، مما يزيد من الاستفادة من حركة المرور إلى الجنة ، وفي المسافات الطويلة تقلل أيضًا من التأخير في نقل البيانات. اليوم ، ربما تكون أفضل تقنية متاحة في السوق ، ويستحق إلقاء نظرة فاحصة عليها.

Source: https://habr.com/ru/post/ar428249/


All Articles