كيف اختبرنا VMware vSAN ™: لماذا يعمل عمليا

منذ عام ، قمت بتجميع مركز بيانات من مجموعة من Intel NUC . كان هناك نظام تخزين برمجيات لم تتمكن سيدة التنظيف من تدميره ، وانهارت الكتلة عدة مرات.

والآن قررنا تشغيل vSAN على عدة خوادم في تكوين جيد جدًا من أجل التقييم الكامل للأداء والتسامح مع الخطأ للحل. بالطبع ، كان لدينا عدد من عمليات التنفيذ الناجحة في الإنتاج لعملائنا ، حيث نجحت vSAN في حل المهام المحددة ، ولكن لم يكن من الممكن إجراء اختبار شامل. في الواقع ، أريد مشاركة نتائج الاختبار اليوم.

سنقوم بتعذيب التخزين بحمل ، وإسقاطه وبكل طريقة ممكنة اختبار التسامح مع الخطأ. لمزيد من التفاصيل ، أدعو الجميع إلى القطط.

ما هو برنامج VMware vSAN بشكل عام ولماذا دخلنا فيه؟


هناك مجموعة خادم عادية للأجهزة الافتراضية. يحتوي على مجموعة من المكونات المستقلة ، ويعمل برنامج Hypervisor مباشرة على الأجهزة ، ويتم تكوين التخزين بشكل منفصل على أساس DAS أو NAS أو SAN. بيانات بطيئة على الأقراص الصلبة ، والبيانات الساخنة على SSD. كل شيء مألوف. ولكن هنا تكمن المشكلة في نشر وإدارة حديقة الحيوان هذه. يصبح الأمر ممتعًا بشكل خاص في المواقف التي تكون فيها العناصر الفردية للنظام من البائعين المختلفين. في حالة حدوث مشاكل ، فإن إرساء تذاكر الدعم الفني من مختلف الشركات المصنعة له جو خاص به.

هناك قطع منفصلة من الحديد ، والتي تبدو من وجهة نظر الخادم وكأنها أقراص للتسجيل.

وهناك أنظمة شديدة التقارب. فيها ، يتم إعطاؤك وحدة عالمية تتحمل الصداع الكامل لتفاعل الشبكة والأقراص والمعالجات والذاكرة وتلك الأجهزة الافتراضية التي تدور عليها. تتدفق جميع البيانات إلى لوحة تحكم واحدة ، وإذا لزم الأمر ، يمكنك ببساطة إضافة وحدتين إضافيتين للتعويض عن زيادة الحمل. الإدارة مبسطة وموحدة إلى حد كبير.


يشير VMware vSAN فقط إلى الحلول التي يتم نشرها على أساسها
البنية التحتية شديدة التقارب. السمة الرئيسية للمنتج هي التكامل التام مع نظام المحاكاة الافتراضية VMware vSphere ، وهو رائد بين حلول المحاكاة الافتراضية التي تسمح لك بنشر تخزين البرامج للأجهزة الافتراضية على خوادم المحاكاة الافتراضية في دقائق. يتحكم vSAN بشكل مباشر في عمليات الإدخال / الإخراج على مستوى منخفض ، ويوزع الحمل على النحو الأمثل ، ويخزن عمليات القراءة / الكتابة في ذاكرة التخزين المؤقت ويقوم بالكثير مع الحد الأدنى من الحمل على الذاكرة والمعالج. يتم تقليل شفافية النظام بشكل طفيف ، ولكن نتيجة لذلك ، يعمل كل شيء ، كما يقولون ، يمكن تكوين vSAN تلقائيًا كمخزن هجين وفي شكل إصدار فلاش بالكامل. يتم تحجيمه أفقيًا عن طريق إضافة عقد جديدة إلى الكتلة ، وعموديًا ، مما يزيد من عدد الأقراص في العقد الفردية. تعد إدارة عميل ويب vSphere الخاص بهم أمرًا مريحًا للغاية نظرًا للتكامل المحكم مع المنتجات الأخرى.

لقد توصلنا إلى تكوين نظيف لكل الفلاش ، والذي يجب أن يكون الأمثل من حيث السعر والأداء. من الواضح أن السعة الإجمالية أقل قليلاً مقارنة بالتكوين الهجين باستخدام الأقراص المغناطيسية ، ولكننا قررنا هنا التحقق من كيفية التحايل جزئيًا على هذا باستخدام تشفير المحو ، وكذلك إلغاء البيانات المكررة والضغط على الطاير. ونتيجة لذلك ، تصبح كفاءة التخزين أقرب إلى الحلول الهجينة ، ولكنها أسرع بشكل ملحوظ مع الحد الأدنى من النفقات العامة.

كيفية الاختبار


لاختبار الأداء ، استخدمنا برنامج HCIBench v1.6.6 ، والذي يعمل على أتمتة عملية إنشاء العديد من الأجهزة الافتراضية ومن ثم تجميع النتائج. يتم إجراء اختبار الأداء نفسه باستخدام برنامج Vdbench ، وهو أحد أشهر برامج اختبار الحمل الاصطناعي. كان الحديد في خيارات التكوين التالية:

  1. كل الفلاش - مجموعتان من الأقراص: 1xNVMe SSD Samsung PM1725800 GB + 3xSATA
  2. SSD توشيبا HK4E 1.6 تيرابايت.
  3. All-flash - مجموعة أقراص واحدة: 1xNVMe SSD Samsung PM1725800 GB + 6xSATA SSD Toshiba HK4E 1.6 TB.
  4. All-flash - مجموعة أقراص واحدة: 1xNVMe SSD Samsung PM1725 800GB + 6xSATA SSD Toshiba HK4E 1.6 TB + Space Efficiency (إلغاء البيانات المكررة والضغط).
  5. All-flash - مجموعة أقراص واحدة: 1xNVMe SSD Samsung PM1725 800GB + 6xSATA SSD Toshiba HK4E 1.6 TB + Erasure Coding (RAID 5/6).
  6. All-flash - مجموعة أقراص واحدة: 1xNVMe SSD Samsung PM1725 800GB + 6xSATA SSD Toshiba HK4E 1.6 TB + Erasure Coding (RAID 5/6) + كفاءة المساحة (إلغاء البيانات المكررة والضغط).

خلال الاختبارات ، قمنا بمحاكاة ثلاثة أحجام مختلفة من البيانات النشطة التي تستخدمها التطبيقات: 1 تيرابايت (250 جيجا بايت لكل خادم) ، 2 تيرابايت (500 جيجا بايت لكل خادم) و 4 تيرابايت (1 تيرابايت لكل منهما).

لكل تكوين ، تم تنفيذ نفس مجموعة الاختبارات باستخدام ملفات تعريف التحميل التالية:

  1. 0 قراءة / 100 كتابة ، بشكل عشوائي 50٪ ، حجم الكتلة - 4 كيلو.
  2. 30 قراءة / 70 كتابة ، بشكل عشوائي 50٪ ، حجم الكتلة - 4 كيلو.
  3. 70 قراءة / 30 كتابة ، بشكل عشوائي 50٪ ، حجم الكتلة - 4 كيلو.
  4. 100 قراءة / 0 كتابة ، بشكل عشوائي 50٪ ، حجم الكتلة - 4 كيلو.

هناك حاجة إلى الخيارين الأول والرابع لفهم كيفية تصرف النظام تحت الأحمال القصوى والدنيا. لكن الثاني والثالث أقرب ما يمكن إلى حالة الاستخدام النموذجية الحقيقية: على سبيل المثال ، 30 قراءة / 70 كتابة - VDI. كانت تلك الأحمال التي واجهتها في الإنتاج قريبة جدًا منها. في هذه العملية ، قمنا باختبار فعالية آلية إدارة بيانات vSAN.

بشكل عام ، أثبت النظام أنه جيد جدًا. بناءً على نتائج الاختبار ، أدركنا أنه يمكننا الاعتماد على الأداء في منطقة 20 ألف IOPS لكل عقدة. بالنسبة للمهام العادية والمحملة بشكل كبير ، فهذه مؤشرات جيدة مع مراعاة التأخيرات التي تبلغ 5 مللي ثانية. أدناه أعطيت الرسوم البيانية مع النتائج:







جدول الملخص مع نتائج الاختبار:

يشير اللون الأخضر إلى البيانات النشطة المخزنة مؤقتًا بالكامل.

التسامح مع الخطأ


لقد قطعت عقدة واحدة تلو الأخرى ، على الرغم من سخط الآلة ، ونظرت في رد فعل النظام ككل. بعد فصل العقدة الأولى ، لم يحدث شيء على الإطلاق ، باستثناء انخفاض طفيف في الأداء ، بحوالي 10-15٪. أخرجت العقدة الثانية - بعض الأجهزة الافتراضية مغلقة ، لكن الباقي استمر في العمل مع انخفاض طفيف في الأداء. يسر البقاء العام. إعادة تشغيل جميع العقد - فكر النظام قليلاً ومزامنته مرة أخرى دون أي مشاكل ، بدأت جميع الأجهزة الافتراضية دون أي مشاكل. مثل في وقت واحد على NUCs. سلامة البيانات لا تتأثر ، وهو أمر مسرور للغاية.

الانطباعات العامة


أنظمة التخزين المحددة بالبرمجيات (SDS) هي بالفعل تقنية ناضجة.

اليوم ، أحد عوامل التوقف الرئيسية التي تقف في طريق تنفيذ vSAN هو التكلفة العالية نوعًا ما للترخيص بالروبل. إذا قمت بإنشاء البنية التحتية من البداية ، فقد يتبين أن نظام التخزين التقليدي في تكوين مشابه سيكلف نفس التكلفة تقريبًا. ولكنها ستكون أقل مرونة سواء من حيث الإدارة أو التوسع. لذلك اليوم ، عند اختيار حل لتخزين بيانات الجهاز الظاهري على منصة vSphere الظاهرية ، من الجيد جدًا أن تزن جميع إيجابيات وسلبيات استخدام الحلول التقليدية وتنفيذ تكنولوجيا التخزين المعرفة بالبرمجيات.

يمكنك بناء حل على نفس Ceph أو GlusterFS ، ولكن عند العمل مع بنية VMware التحتية ، فإن دمج vSAN مع المكونات الفردية آسر ، بالإضافة إلى سهولة الإدارة والنشر وأداء أكبر بكثير ، خاصة على عدد صغير من العقد. لذلك ، إذا كنت تعمل بالفعل على البنية التحتية لـ VMware ، فسيكون من الأسهل بكثير عليك النشر. أنت حقًا تقوم بعشر نقرات وتحصل على SDS عاملة.

الدافع الآخر لنشر vSAN هو استخدامه للفروع ، والذي يسمح لك بعكس العقد في الوحدات البعيدة مع مضيف شاهد في مركز البيانات. يوفر هذا التكوين مساحة تخزين تتحمل الأخطاء للأجهزة الافتراضية مع جميع تقنيات vSAN والأداء على عقدتين فقط. بالمناسبة ، لاستخدام vSAN هناك نظام ترخيص منفصل لعدد الأجهزة الظاهرية ، والذي يسمح بتقليل التكاليف بالمقارنة مع نظام ترخيص vSAN التقليدي للمعالجات.

من الناحية المعمارية ، يتطلب الحل 10 جيجابت إيثرنت مع ارتباطين لكل عقدة لتوزيع حركة المرور بشكل مناسب عند استخدام حل الفلاش بالكامل. مقارنةً بالأنظمة التقليدية ، يمكنك توفير مساحة رف وتوفير على شبكات SAN من خلال التخلص من القناة الليفية لصالح معيار Ethernet الأكثر عالمية. لضمان التسامح مع الخطأ ، مطلوب ثلاث عقد على الأقل ، على نسختين متماثلتين من الكائنات مع البيانات ، وعلى الثالث - شاهد الأشياء لهذه البيانات ، يحل مشكلة الانقسام في الدماغ.

الآن بعض الأسئلة لك:

  1. عندما تقرر نظام تخزين ، ما هي المعايير الأكثر أهمية بالنسبة لك؟
  2. ما هي عوامل التوقف التي تراها في مسار تنفيذ أنظمة التخزين المعرفة بالبرامج؟
  3. ما أنظمة التخزين المعرفة بالبرامج التي تعتبرها في الأساس خيارًا للتنفيذ؟


UPD: لقد نسيت تمامًا كتابة معلمات تكوين الحامل وتحميله:

1. وصف الحديد. على سبيل المثال:
الخوادم - 4xDellR630 ، لكل منها:
• 2xE5-2680v4
• ذاكرة وصول عشوائي سعتها 128 جيجابايت
• 2 × 10 جيجابت
• 2x1GbE للإدارة / شبكة VM
• ديل HBA330
تكوين التخزين # 1:
2xPM1725 800 جيجابايت
6xToshiba HK4E 1.6 تيرابايت
تكوين التخزين # 2:
1xPM1725 800 جيجابايت
6xToshiba HK4E 1.6 تيرابايت

2. وصف إصدارات البرامج:
vSphere 6.5U1 (7967591) (vSAN 6.6.1) ، أي بقع بعد الانهيار / شبح
vCenter 6.5U1g
أحدث برامج التشغيل المدعومة و FW بواسطة vSAN و ESXi لجميع المكونات
LACP لحركة vSAN وحركة vMotion (مع تمكين مشاركات / حدود / حجز NIOC)
جميع الإعدادات الأخرى هي الإعدادات الافتراضية

3. معلمات الحمل:
• HCIBench 1.6.6
• Oracle Vdbench - 04/05/06
• 40VM لكل عنقود (10 لكل عقدة)
• 10 vmdk لكل VM
• حجم 10 جيجابايت من vmdk ونسبة 100/50/25٪ من عبء العمل
• وقت الإحماء -1800 ثانية (0.5 ساعة) ، وقت الاختبار 3600 (ساعة واحدة)
• 1 المواضيع لكل vmdk

Source: https://habr.com/ru/post/ar414125/


All Articles