كيفية اختيار التخزين دون اطلاق النار على نفسك في القدم

مقدمة


حان الوقت لشراء التخزين. أي واحد لاتخاذ ، لمن الاستماع إلى؟ Vendor A يتحدث عن البائع B ، وهناك أيضًا مُدمج C يُخبر الطرف الآخر وينصح البائع D. في هذه الحالة ، سوف يتجول أيضًا مهندس تخزين ذو خبرة ، خاصة مع جميع البائعين الجدد و SDS اليوم والتقارب المفرط.

لذا ، كيف يمكنك معرفة هذا وعدم الغباء؟ سنحاول نحن ( AntonVirtual Anton Zhbankov و korp Evgeny Elizarov) معرفة ذلك باللغة الروسية بالأبيض.
يشتمل المقال على الكثير من العناصر المشتركة ، وهو في الواقع امتداد لـ " تصميم مركز بيانات افتراضي " من حيث اختيار أنظمة تخزين البيانات ونظرة عامة على تقنية التخزين. نحن ننظر لفترة وجيزة إلى النظرية العامة ، لكننا نوصيك بأن تتعرف على هذه المقالة.

لماذا


غالبًا ما يمكنك ملاحظة الموقف عندما يأتي شخص جديد إلى أحد المنتديات أو في غرفة محادثة متخصصة ، مثل مناقشات التخزين ويسأل السؤال التالي: "هنا عرض علي خياران للتخزين - ABC SuperStorage S و XYZ HyperOcean 666v4 ، ما الذي تنصح به؟"

ويبدأ شخص ما في قياس ميزات تطبيق الرقائق المخيفة وغير المفهومة ، والتي بالنسبة لشخص غير مستعد ، هي رسالة صينية على الإطلاق.

لذلك ، فإن السؤال الرئيسي والأول الذي تحتاج إلى طرحه قبل وقت طويل من مقارنة المواصفات في العروض التجارية هو لماذا؟ لماذا هذا التخزين ضروري؟

صورة

الإجابة ستكون غير متوقعة ، وفي أسلوب توني روبنز - لتخزين البيانات. شكرا لك الكابتن! ومع ذلك ، في بعض الأحيان نذهب إلى أبعد من ذلك بكثير من المقارنة بين التفاصيل التي ننسى لماذا نفعل كل هذا على الإطلاق.

لذلك ، فإن مهمة نظام تخزين البيانات هي تخزين وتوفير الوصول إلى البيانات مع أداء معين. سنبدأ مع البيانات.

معطيات


نوع البيانات


ما نوع البيانات التي نخطط لتخزينها؟ مشكلة مهمة للغاية يمكنها حذف العديد من أنظمة التخزين حتى من الاعتبار. على سبيل المثال ، من المخطط تخزين مقاطع الفيديو والصور. يمكنك على الفور حذف الأنظمة المصممة للوصول العشوائي من خلال كتلة صغيرة ، أو الأنظمة التي تحتوي على شرائح خاصة في الضغط / إلغاء البيانات المكررة. يمكن أن يكون مجرد أنظمة ممتازة ، ونحن لا نريد أن نقول أي شيء سيء. لكن في هذه الحالة ، ستصبح نقاط قوتها ضعيفة على العكس (لا يتم ضغط مقاطع الفيديو والصور) أو ببساطة زيادة كبيرة في تكلفة النظام.

على العكس من ذلك ، إذا كان الاستخدام المقصود هو DBMS للمعاملات المحملة ، فإن أنظمة دفق الوسائط المتعددة الممتازة القادرة على توفير غيغا بايت في الثانية ستكون اختيارًا سيئًا.

حجم البيانات


ما مقدار البيانات التي نخطط لتخزينها؟ تنمو الكمية دائمًا لتصبح ذات جودة ؛ لا ينبغي أن ننسى هذا أبدًا ، خاصة في عصرنا من النمو الهائل لحجم البيانات. لم تعد أنظمة فئة Petabyte نادرة ، ولكن كلما زاد حجم وحدات بايت ، كلما أصبح النظام أكثر تحديدًا ، كانت وظائف الأنظمة أقل قدرة على الوصول بشكل عشوائي من وحدات التخزين الصغيرة والمتوسطة. مبتذلة لأن جداول إحصائيات الوصول حسب الكتل تصبح أكبر من ذاكرة الوصول العشوائي المتاحة على وحدات التحكم. ناهيك ضغط / تمزيق. لنفترض أننا نريد تبديل خوارزمية الضغط إلى واحدة أكثر قوة والضغط على 20 بيتابايت من البيانات. كم من الوقت سيستغرق: نصف عام ، سنة؟

من ناحية أخرى ، لماذا تهتم بحديقة إذا كنت بحاجة إلى تخزين ومعالجة 500 جيجابايت من البيانات؟ فقط 500. SSDs المنزلية (انخفاض DWPD) من هذا الحجم لا تكلف شيئا على الإطلاق. لماذا بناء مصنع قناة ليفية وشراء نظام تخزين خارجي متطور بتكلفة جسر من الحديد الزهر؟

ما هي النسبة المئوية من إجمالي البيانات الساخنة؟ ما مدى عدم تحميل البيانات؟ هذا هو المكان الذي يمكن أن تساعد فيه تقنية التخزين المتدرج أو Flash Cache حقًا إذا كانت كمية البيانات الساخنة ضئيلة مقارنة بالعدد الإجمالي. أو بالعكس ، مع وجود حمل موحد عبر كامل وحدة التخزين ، غالبًا ما توجد في أنظمة البث (المراقبة بالفيديو ، بعض أنظمة التحليل) ، فإن هذه التقنيات لن تعطي شيئًا ، وستزيد فقط من تكلفة / تعقيد النظام.

IC


الجانب العكسي للبيانات هو نظام معلومات يستخدم هذه البيانات. IP لديه مجموعة من المتطلبات التي ترث البيانات. لمزيد من المعلومات حول IP ، راجع "تصميم مركز بيانات افتراضي".

متطلبات تجاوز الفشل / التوفر



يتم توارث متطلبات التسامح مع الخطأ / توفر البيانات من IS باستخدامها ويتم التعبير عنها بثلاثة أرقام - توفر RPO ، RTO ،.

التوفر - مشاركة لفترة زمنية محددة تتوفر خلالها البيانات للعمل معهم. يتم التعبير عنها عادةً بمبلغ 9. على سبيل المثال ، يعني تسع مداخيل كل عام أن التوافر هو 99٪ ، أو غير مسموح بـ 95 ساعة في السنة. ثلاث تسع - 9.5 ساعات في السنة.

RPO / RTO - هذه ليست مؤشرات موجزة ، ولكن لكل حادث (حادث) ، مقابل التوافر.

RPO - مقدار البيانات المفقودة أثناء الحادث (بالساعات). على سبيل المثال ، إذا قمت بالنسخ الاحتياطي مرة واحدة يوميًا ، فعندئذ RPO = 24 ساعة. أي في حالة وقوع حادث وفقدان كامل للتخزين ، قد تُفقد البيانات التي تصل إلى 24 ساعة (من وقت النسخ الاحتياطي). استنادًا إلى RPO المحدد لـ IS ، على سبيل المثال ، تتم كتابة جدول النسخ الاحتياطي. أيضًا ، استنادًا إلى RPO ، يمكنك فهم مقدار النسخ المتماثل للبيانات المتزامن / غير المتزامن المطلوب.

RTO - وقت استرداد الخدمة (الوصول إلى البيانات) بعد وقوع حادث. بناءً على قيمة RTO المحددة ، يمكننا أن نفهم ما إذا كانت هناك حاجة إلى كتلة metro ، أو أن النسخ المتماثل أحادي الاتجاه يكفي. هل أحتاج إلى فئة تخزين متعددة وحدة تحكم متطورة - أيضًا.

صورة

متطلبات الأداء


على الرغم من حقيقة أن هذا سؤال واضح للغاية ، فإن معظم الصعوبات تنشأ عنه. بناءً على ما إذا كان لديك بالفعل نوع من البنية التحتية أم لا ، وسيتم بناء طرق لجمع الإحصاءات اللازمة.

لديك بالفعل نظام تخزين وتبحث عن بديل له أو ترغب في شراء نظام آخر للتوسع. كل شيء بسيط هنا. أنت تفهم الخدمات التي لديك بالفعل والخدمات التي تخطط لتنفيذها في المستقبل القريب. بناءً على الخدمات الحالية ، لديك الفرصة لجمع إحصائيات الأداء. حدد العدد الحالي من IOPS والتأخير الحالي - ما هي هذه المؤشرات وهل هناك ما يكفي لمهامك؟ يمكن القيام بذلك على نظام تخزين البيانات نفسه ومن جانب المضيفين المتصلين به.

علاوة على ذلك ، تحتاج إلى مراقبة ليس فقط الحمل الحالي ، ولكن لبعض الوقت (شهر أفضل). تعرف على الحد الأقصى للقمم في النهار ، ونوع التحميل الذي تنشئه النسخة الاحتياطية ، وما إلى ذلك. إذا لم يوفر لك التخزين أو البرنامج الخاص بك مجموعة كاملة من هذه البيانات ، فيمكنك استخدام RRDtool المجاني ، والذي يمكنه العمل مع أكثر وحدات التخزين ووحدات التبديل شيوعًا ويمكن أن يوفر لك إحصائيات مفصلة عن الأداء. يجدر أيضًا النظر في الحمل على الأجهزة المضيفة التي تعمل مع نظام التخزين هذا ، أو على أجهزة افتراضية محددة ، أو ما الذي يناسبك تمامًا على هذا المضيف.

صورة

تجدر الإشارة بشكل منفصل إلى أنه إذا كانت التأخيرات في وحدة التخزين ومخزن البيانات الموجود على هذا المجلد تختلف كثيرًا - يجب الانتباه إلى شبكة SAN الخاصة بك ، فمن المحتمل أن تكون هناك مشاكل معها وقبل شراء نظام جديد ، يجب عليك التعامل مع هذه المشكلة ، لأن احتمال زيادة أداء النظام الحالي مرتفع للغاية.

تقوم ببناء البنية التحتية من نقطة الصفر ، أو شراء نظام لنوع من الخدمة الجديدة ، التي لا تعرف الكثير عنها. هناك العديد من الخيارات: التواصل مع الزملاء حول الموارد المتخصصة لمحاولة اكتشاف الحمل والتنبؤ به ، اتصل بمكامل لديه خبرة في تنفيذ مثل هذه الخدمات والذي يمكنه حساب الحمل لك. والخيار الثالث (عادة الأصعب ، خاصة عندما يتعلق الأمر بالتطبيقات المكتوبة ذاتيا أو النادرة) هو محاولة معرفة متطلبات الأداء لمطوري النظام.

والانتباه ، فإن الخيار الأصح من وجهة نظر التطبيق العملي هو تجربة المعدات الحالية ، أو المعدات المقدمة للاختبار من قبل البائع / الموحد.

متطلبات خاصة


المتطلبات الخاصة - كل ذلك لا يندرج تحت متطلبات الأداء والتسامح مع الأخطاء ووظائف المعالجة المباشرة وتوفير البيانات.

أحد أبسط المتطلبات الخاصة لنظام تخزين البيانات هو "وسائط التخزين المنفردة". وعلى الفور يصبح من الواضح أن نظام تخزين البيانات هذا يجب أن يتضمن مكتبة أشرطة أو مجرد محرك أقراص ، تتم إعادة تعيين النسخة الاحتياطية عليه. ثم يقوم شخص مدرب بشكل خاص بتوقيع الشريط ويحمله بفخر في خزانة خاصة.
مثال آخر على المتطلبات الخاصة هو أداء محمي ضد الصدمات.

حيث


المكون الرئيسي الثاني في اختيار نظام تخزين واحد أو آخر هو معلومات حول مكان وجود نظام التخزين هذا. بدءا من الجغرافيا أو الظروف المناخية ، وتنتهي مع الموظفين.

زبون


لمن هو هذا التخزين المخطط؟ السؤال له الأسباب التالية:

عميل الحكومة / التجارية.
ليس لدى أي عميل تجاري أي قيود ، وهو غير ملزم حتى بإجراء المناقصات ، إلا وفقًا للوائح الداخلية الخاصة به.

عميل الدولة هو مسألة مختلفة. 44 القانون الاتحادي والمسرات الأخرى مع المناقصات والمعارف التقليدية ، والتي يمكن الطعن فيها.

العملاء فرضت عليها عقوبات
حسنًا ، السؤال بسيط للغاية - الخيار محدود فقط بالعروض المتاحة لهذا العميل.

اللوائح الداخلية / الباعة / النماذج المعتمدة
السؤال بسيط للغاية ، لكن يجب أن نتذكره.

حيث جسديا


في هذا الجزء ، نعتبر جميع المشكلات المتعلقة بالجغرافيا وقنوات الاتصال والمناخ الداخلي.

الموظفين


من سيعمل مع هذا التخزين؟ هذا لا يقل أهمية عن ما يمكن أن تفعله التنمية البشرية المستدامة مباشرة.
مهما كان نظام التخزين واعداً وباردًا ورائعًا هو من البائع أ ، فربما لا توجد فائدة تذكر في تحديد ما إذا كان الموظفون يستطيعون العمل مع البائع ب فقط ، ولا توجد خطط لمزيد من المشتريات والتعاون المستمر مع A.

وبالطبع ، فإن الجانب الآخر من السؤال هو كيف يمكن الوصول إلى الموظفين المدربين مباشرة في الشركة وربما في سوق العمل في هذا الموقع الجغرافي. بالنسبة للمناطق ، فإن اختيار أنظمة التخزين ذات الواجهات البسيطة أو إمكانية الإدارة المركزية عن بُعد يمكن أن يكون له معنى كبير. خلاف ذلك ، في مرحلة ما يمكن أن تصبح مؤلمة بشكل مؤلم. الإنترنت مليء بالقصص حيث توصل الموظف الجديد ، طالب الأمس ، إلى تكوين بحيث قتل المكتب بأكمله.

صورة

البيئة


حسنًا ، بالطبع ، السؤال المهم هو البيئة التي سيعمل بها هذا التخزين.

  • ماذا عن الطاقة / التبريد؟
  • ما الصدد
  • أين سيتم تثبيته
  • و هكذا.

غالبًا ما يتم اعتبار هذه المشكلات أمراً مفروغًا منه ولا يتم تناولها بشكل خاص ، لكن في بعض الأحيان يمكنها أن تغير كل شيء معكوسًا تمامًا.

ما


بائع


اليوم (منتصف 2019) ، يمكن تقسيم سوق التخزين الروسي إلى 5 فئات مشروطة:

  1. أفضل قسم - الشركات المتميزة مع مجموعة واسعة من أبسط أرفف الأقراص إلى الأحدث (HPE و DellEMC و Hitachi و NetApp و IBM / Lenovo)
  2. القسم الثاني - الشركات التي تضم تشكيلة محدودة أو لاعبين متخصصين أو بائعي خدمات SDS أو القادمين الجدد الصاعدين (Fujitsu و Datacore و Infinidat و Huawei و Pure وما إلى ذلك)
  3. القسم الثالث - حلول متخصصة في المرتبة المنخفضة ، SDS الرخيصة ، والممارسة الجيدة على ceph والمشاريع المفتوحة الأخرى (Infortrend ، Starwind ، إلخ.)
  4. شريحة SOHO - أنظمة تخزين صغيرة وصغيرة جدًا على مستوى المنازل / المكاتب الصغيرة (Synology ، QNAP ، إلخ)
  5. أنظمة تخزين بديلة للاستيراد - وهذا يشمل كلاً من القسم الأول ذي الملصقات اللاصقة وممثلي نادر من الثانية (RAIDIX ، دعنا نعطيهم تقدمًا في الجزء الثاني) ، ولكن في الغالب هذا هو القسم الثالث (Aerodisk ، Baum ، Depo ، إلخ.)

القسمة تعسفية إلى حد ما ، ولا تعني على الإطلاق أن الجزء الثالث أو مقطع SOHO سيئ ولا يمكن استخدامه. في مشاريع محددة مع مجموعة بيانات محددة بوضوح وملف تعريف الحمل ، يمكن أن تعمل بشكل جيد للغاية ، متجاوزةً القسم الأول من حيث نسبة السعر / الجودة. من المهم أن تقرر أولاً المهام ، وآفاق النمو ، والوظائف المطلوبة - ومن ثم ستعمل Synology على خدمتك بأمانة ، وسيصبح شعرك ناعمًا وناعمًا.

البيئة الحالية هي أحد العوامل المهمة عند اختيار البائع. ما هو عدد أنظمة التخزين التي تملكها بالفعل وما هي أنظمة التخزين التي يمكن للمهندسين العمل معها. هل تحتاج إلى بائع آخر ، جهة اتصال أخرى ، هل ستقوم تدريجياً بترحيل الحمل بالكامل من البائع أ إلى البائع ب؟

ليس من الضروري إنتاج كيانات تتجاوز ما هو ضروري.

iSCSI / FC / ملف


فيما يتعلق بمسألة بروتوكولات الوصول ، لا يوجد إجماع بين المهندسين ، وتشبه النزاعات مناقشات لاهوتية أكثر من تلك الهندسية. ولكن بشكل عام ، يمكن الإشارة إلى النقاط التالية:

FCoE هو الأرجح ميت على قيد الحياة.

FC مقابل iSCSI . إحدى الميزات الرئيسية لـ FC في عام 2019 على تخزين IP ، وهو مصنع مخصص للوصول إلى البيانات ، تم تسويته بواسطة شبكة IP مخصصة. لا يوجد لدى FC مزايا عالمية عبر شبكات IP ويمكن استخدام IP لبناء أنظمة تخزين من أي مستوى تحميل ، حتى أنظمة قواعد بيانات إدارة قواعد البيانات (DBMS) الثقيلة للحصول على ABS لبنك كبير. من ناحية أخرى ، لم يتم التنبؤ بوفاة إف سي ليس للسنة الأولى ، ولكن هناك شيئًا ما يتعارض مع ذلك. اليوم ، على سبيل المثال ، يعمل بعض اللاعبين في سوق التخزين على تطوير معيار NVMEoF. ما إذا كان يشارك مصير FCoE - الوقت سوف اقول.

الوصول إلى الملفات هو أيضا لا يستحق الاهتمام. يعمل NFS / CIFS بشكل جيد في البيئات الإنتاجية ، وعند تصميمه بشكل صحيح ، لا يوجد لديه شكاوى أكثر من بروتوكولات الكتلة.

الهجين / جميع فلاش مجموعة


أنظمة التخزين الكلاسيكية تأتي في نوعين:

  1. AFA (All Flash Array) - أنظمة مُحسّنة لاستخدام SSD.
  2. مختلط - يتيح لك استخدام كل من محركات الأقراص الثابتة ومحركات أقراص الحالة الثابتة ، أو مزيج من الاثنين.

الفرق الرئيسي بينهما هو تقنيات كفاءة التخزين المدعومة والمستوى الأقصى للأداء (IOPS العالي والكمون المنخفضة). كل من هذه الأنظمة والأنظمة الأخرى (في معظم طرازاتها ، دون حساب الجزء المنخفض النهاية) يمكنها تشغيل أجهزة الكتلة وأجهزة الملفات. تعتمد الوظائف المدعومة والنماذج الأصغر سنا أيضًا على مستوى النظام ؛ وغالبًا ما يتم قطعها إلى مستوى أدنى. يجب الانتباه إلى هذا عند دراسة خصائص نموذج معين ، وليس فقط قدرات الخط بأكمله ككل. بالطبع ، تعتمد خصائصه التقنية أيضًا على مستوى النظام ، مثل المعالج وكمية الذاكرة وذاكرة التخزين المؤقت وعدد المنافذ وأنواعها ، إلخ. من وجهة نظر الإدارة ، تختلف AFA من الأنظمة المختلطة (القرص) فقط في تنفيذ آليات العمل مع محركات أقراص SSD ، وحتى إذا كنت تستخدم SSD في نظام هجين ، فإن هذا لا يعني أنه يمكنك الحصول على مستوى من الأداء على مستوى AFA للنظام. . أيضًا ، في معظم الحالات ، يتم تعطيل الآليات المضمنة للتخزين الفعال على الأنظمة الهجينة ، ويؤدي تضمينها إلى فقد في الأداء.

تخزين خاص


بالإضافة إلى التخزين للأغراض العامة ، والذي يركز بشكل أساسي على معالجة البيانات التشغيلية ، هناك أنظمة تخزين خاصة ذات مبادئ أساسية تختلف اختلافًا جوهريًا عن الأنظمة المعتادة (الكمون المنخفض ، والعديد من عمليات IOPS):

وسائل الاعلام.

تم تصميم هذه الأنظمة لتخزين ومعالجة ملفات الوسائط الكبيرة الحجم. على التوالي. يصبح التأخير غير مهم عملياً ، وتحتل القدرة على إرسال واستقبال البيانات في نطاق واسع في العديد من التدفقات المتوازية مكان الصدارة.

تخزين نسخة مكررة من النسخ الاحتياطية.

نظرًا لاختلاف النسخ الاحتياطية في الود ، وهو أمر نادر الحدوث في الظروف العادية (يختلف متوسط ​​النسخ الاحتياطي عن البارحة بنسبة 1-2٪) ، فإن هذه الفئة من النظم تحزم بشكل فعال للغاية البيانات المسجلة عليها في عدد صغير إلى حد ما من الوسائط المادية. على سبيل المثال ، في بعض الحالات ، يمكن أن تصل نسب ضغط البيانات إلى 200 إلى 1.

تخزين الأشياء

لا تحتوي أنظمة التخزين هذه على وحدات التخزين المعتادة مع وصول الكتلة وكرة الملفات ، والأهم من ذلك أنها تشبه قاعدة بيانات ضخمة. يتم الوصول إلى كائن مخزّن في مثل هذا النظام بواسطة معرف فريد أو بيانات التعريف (على سبيل المثال ، جميع الكائنات بتنسيق JPEG ، مع تاريخ الإنشاء بين XX-XX-XXXX و YY-YY-YYYY).

نظام الامتثال .

لا يوجد كثير من الأحيان في روسيا اليوم ، ولكن تجدر الإشارة إليها. الغرض من أنظمة التخزين هذه هو ضمان تخزين البيانات من أجل الامتثال لسياسات الأمان أو المتطلبات التنظيمية. في بعض الأنظمة (على سبيل المثال ، EMC Centera) ، تم تنفيذ وظيفة حظر حذف البيانات - بمجرد تشغيل المفتاح وانتقال النظام إلى هذا الوضع ، لا يستطيع المسؤول ولا أي شخص آخر حذف البيانات المسجلة بالفعل فعليًا.

تكنولوجيا الملكية


ذاكرة التخزين المؤقت فلاش


Flash Cache هو الاسم الشائع لجميع تقنيات الملكية لاستخدام ذاكرة الفلاش كذاكرة تخزين مؤقت من المستوى الثاني. عند استخدام ذاكرة التخزين المؤقت للفلاش ، عادةً ما يتم حساب التخزين لتوفير حمل ثابت من الأقراص المغناطيسية ، بينما تخدم ذاكرة التخزين المؤقت القصوى ذروة التحميل.

من الضروري فهم ملف تعريف التحميل ودرجة توطين المكالمات إلى كتل حجم التخزين. ذاكرة التخزين المؤقت للفلاش هي تقنية للأحمال ذات التوطين العالي للطلبات ، ولا تنطبق عمليًا على وحدات التخزين المحملة بالتساوي (مثل أنظمة التحليل).

تتوفر تطبيقات ذاكرة التخزين المؤقت فلاش في السوق:

  • قراءة فقط. في هذه الحالة ، يتم تخزين البيانات المقروءة مؤقتًا فقط ، والكتابة تذهب مباشرة إلى الأقراص. تعتقد بعض الشركات المصنعة ، مثل NetApp ، أن الكتابة إلى نظام التخزين الخاص بها هي الأمثل ، ولن تساعد ذاكرة التخزين المؤقت.
  • القراءة / الكتابة. , , RAID Penalty, .

Tiering


() — , SSD HDD. , , , , .

تستخدم الأنظمة الهجينة للفئات الدنيا والمتوسطة مستوى تخزين متعدد المستويات مع نقل البيانات بين المستويات في جدول. في نفس الوقت ، حجم كتلة التخزين المتدرج لأفضل الموديلات هو 256 ميجابايت. لا تسمح لنا هذه الميزات بالنظر في تكنولوجيا التخزين متعددة المستويات كتقنية لزيادة الإنتاجية ، كما يعتبرها الكثيرون عن طريق الخطأ. التخزين متعدد المستويات في أنظمة الطبقة الدنيا والمتوسطة هو تقنية لتحسين تكاليف التخزين للأنظمة ذات تباين الحمل الواضح.

لقطة


بغض النظر عن مدى حديثنا عن موثوقية التخزين ، فهناك العديد من الفرص لفقدان البيانات التي لا تعتمد على مشاكل الأجهزة. يمكن أن يكون مثل الفيروسات أو المتسللين أو أي حذف / تلف غير مقصود للبيانات. لهذا السبب ، تعد النسخ الاحتياطي للبيانات الإنتاجية جزءًا لا يتجزأ من عمل المهندس.

اللقطة هي لقطة لوحدة تخزين في وقت ما. عند العمل مع معظم الأنظمة ، مثل المحاكاة الافتراضية وقواعد البيانات ، إلخ. نحتاج إلى أخذ لقطة ننسخ البيانات منها إلى نسخة احتياطية ، بينما يمكن أن تستمر عناوين IP الخاصة بنا بأمان في العمل مع هذا المجلد. لكن الأمر يستحق التذكر - ليست كل اللقطات مفيدة بنفس القدر. يوجد لدى البائعين المختلفين طرق مختلفة لإنشاء لقطات متعلقة بهندستها المعمارية.

CoW (نسخ عند الكتابة) . , . . «» , .

RoW (Redirect-on-Write) . , , , . , .

:

Application consitent . , . .

Crash consistent . . , . , .

?

  • VDI
  • RPO

Cloning


استنساخ وحدة تخزين - يعمل على مبدأ مماثل مثل اللقطات ، ولكنه لا يخدم فقط قراءة البيانات ، بل يعمل معها تمامًا. نحن قادرون على الحصول على نسخة دقيقة من حجمنا ، مع جميع البيانات الموجودة عليه ، دون عمل نسخة مادية ، مما سيوفر مساحة. عادة ، يتم استخدام استنساخ وحدة التخزين إما في Test & Dev أو إذا كنت تريد التحقق من وظيفة بعض التحديثات على IS الخاص بك. سيسمح لك الاستنساخ بالقيام بذلك في أسرع وقت واقتصاد ممكن من حيث موارد القرص ، مثل سيتم كتابة كتل البيانات المعدلة فقط.

النسخ المتماثل / يوميات


النسخ المتماثل عبارة عن آلية لإنشاء نسخة من البيانات على نظام تخزين فعلي آخر. عادة ، هناك تقنية خاصة لكل بائع يعمل فقط ضمن حدوده الخاصة. ولكن هناك أيضًا حلول لجهة خارجية ، بما في ذلك الحلول التي تعمل على مستوى برنامج Hypervisor ، مثل VMware vSphere Replication.

غالبًا ما تكون وظائف التقنيات الاحتكارية وسهولة استخدامها أعلى بكثير من التقنيات العالمية ، ولكنها لا تنطبق عندما تحتاج ، على سبيل المثال ، إلى عمل نسخة متماثلة من NetApp إلى HP MSA.

يتم تقسيم النسخ المتماثل إلى نوعين فرعيين:

متزامن . في حالة النسخ المتماثل المتزامن ، يتم إرسال عملية الكتابة إلى نظام التخزين الثاني على الفور ولا يتم تأكيد التنفيذ حتى يؤكده نظام التخزين عن بُعد. نتيجة لذلك ، يتزايد تأخير الوصول ، لكن لدينا نسخة طبق الأصل من البيانات. أيRPO = 0 في حالة فقدان التخزين الأساسي.

غير متزامن . يتم تنفيذ عمليات الكتابة فقط على نظام التخزين الرئيسي ويتم تأكيدها على الفور ، وتتراكم بشكل متزامن في المخزن المؤقت لإرسال الحزمة إلى نظام التخزين عن بُعد. هذا النوع من النسخ المتماثل مناسب للبيانات الأقل قيمة ، إما لقنوات النطاق الترددي المنخفض أو مع زمن انتقال عالٍ (نموذجي للمسافات التي تزيد عن 100 كم). على التوالي RPO = تردد إرسال الحزمة.

غالبًا ما توجد آلية تسجيل مع النسخ المتماثلعمليات القرص. في هذه الحالة ، يتم تخصيص منطقة خاصة للتسجيل وتخزين عمليات التسجيل بعمق معين في الوقت المحدد ، أو محدودة بحجم السجل. بالنسبة لبعض تقنيات الملكية ، مثل EMC RecoverPoint ، هناك تكامل مع برنامج النظام الذي يسمح لك بربط إشارات مرجعية محددة بإدخال دفتر يومية محدد. بفضل هذا ، من الممكن استعادة حالة وحدة التخزين (أو إنشاء نسخة) ليس فقط في 23 أبريل 11 ساعة 59 ثانية 13 مللي ثانية ، ولكن في الوقت السابق "DROP ALL TABLES؛ الالتزام ".

كتلة المترو


مجموعة Metro عبارة عن تقنية تتيح لك إنشاء نسخ متماثل ثنائية الاتجاه بين نظامي تخزين بطريقة تجعل هذا الزوج يبدو من الجانب وكأنه نظام تخزين واحد. يتم استخدامه لإنشاء مجموعات ذات أكتاف متباعدة جغرافيا على مسافات المترو (أقل من 100 كم).

باستخدام مثال في بيئة افتراضية ، تتيح لك مجموعة metro إنشاء مخزن بيانات به أجهزة افتراضية يمكن تسجيلها مباشرةً من مركزي بيانات. في هذه الحالة ، يتم إنشاء كتلة على مستوى برنامج Hypervisor ، وتتألف من مضيفين في مراكز بيانات فعلية مختلفة ، متصلة بمخزن البيانات هذا. مما يتيح لك القيام بما يلي:

  • . , , . RTO = (15 VMware) + .
  • Disaster avoidance , -, . 1, , , 2 .


— . - , , RAID .
— EMC VPLEX IBM SVC. — NetApp, Hitachi, IBM / Lenovo Storwize.

?

  • . , HP 3Par, NetApp. EMC.
  • . , 3Par, , Dell. 3Par, VPLEX . , . Dell, 3Par .
  • .

/


— , . , / , , — .

2 :

Inline — . . - , , - .

Post- عند تنفيذ هذه العمليات بالفعل على البيانات المسجلة الموجودة على الأقراص. وفقًا لذلك ، تتم كتابة البيانات لأول مرة على القرص ، وعندها فقط ، يتم حساب التجزئة وإزالة الكتل الإضافية وتحرير موارد القرص.

, , . , , . , , , . , , ( ) . , , , . , AFA , SSD, HDD , , , .

نموذج


.

“ — ABC SuperStorage S600 XYZ HyperOcean 666v4, ”

“ — ABC SuperStorage S600 XYZ HyperOcean 666v4, ?

VMware / / . = . 150 80 000 IOPS 8kb 50% 80/20 -. 300 , 50 000 IOPS , 80 , 80 .

RPO = 15 RTO = 1 , RPO = 3 , .

50 , .

Dell, Hitachi, , 50% ”

, 80% .

معلومات اضافية





  • “ ”. IP / Ethernet
  • “EMC Information Storage and Management”. , , .





الآن ، فيما يتعلق بالأسعار - بشكل عام ، إذا واجهت أسعارًا للتخزين ، فعادةً ما يكون هذا هو سعر القائمة ، والذي يحصل كل عميل منه على خصم فردي. يتكون مبلغ الخصم من عدد كبير من المعلمات ، لذلك من المستحيل ببساطة التنبؤ بالسعر النهائي الذي ستتلقاه شركتك دون طلب إلى الموزع. ولكن في الوقت نفسه ، بدأت النماذج الحديثة في الظهور في متاجر الكمبيوتر العادية ، على سبيل المثال ، nix.ru أو xcom-shop.ru . في نفوسهم ، يمكنك شراء النظام الذي تهتم به على الفور بسعر ثابت ، مثل أي مكونات كمبيوتر.

, TB/$ . , JBOD + , , , , . , JBOD , - — . , JBOD , . . .

في المجموع


تعد مقارنة الأنظمة مع بعضها البعض ضرورية ليس فقط حسب السعر ، أو ليس فقط من خلال الإنتاجية ، ولكن من خلال إجمالي جميع المؤشرات.

اشتري HDD فقط إذا كنت متأكدًا من أنك بحاجة إلى HDD. بالنسبة للحمولات المنخفضة وأنواع البيانات غير القابلة للضغط ، في الحالة المقابلة ، يجدر الانتباه إلى برامج ضمان كفاءة تخزين SSD التي لدى معظم البائعين الآن (وهي تعمل بالفعل ، حتى في روسيا) ، لكن كل هذا يتوقف على التطبيقات والبيانات التي ستكون تقع على هذا التخزين.

لا مطاردة الرخص. أحيانًا يتم إخفاء العديد من اللحظات غير السارة تحت هذه ، والتي وصفها يفغيني إليزاروف في مقالاته حول Infortrend . وهذا ، في النهاية ، يمكن أن يأتي هذا التكلف إلى جانبكم. لا تنسى أن "الجشيع يدفع مرتين".

Source: https://habr.com/ru/post/ar457956/


All Articles