كيف استردت النظام قبل شهر واستعدت كل شيء؟ تجربة استخدام ESXi. أو كيف لا تفعل ذلك

مرحبا بالجميع. قد يبدو هذا لشخص ما قصة مفيدة لكيفية عدم القيام بذلك ولماذا يمكن أن تؤدي بعض الأعمال الفنية الهامة في وقت واحد في الصباح (في نظام لا تفهم فيه إلا القليل) إلى انهيار كبير وتعطل لمدة يومين.


الصورة


ملاحظة قصيرة هي قصة مسؤول نظام هواة بدأ للتو في الغوص في عالم المحاكاة الافتراضية. قصة كيف لم تساعد اللقطات ، لكنها تدخلت وعملت على التراجع عن النظام لمدة شهر ، ثم مع توقف العمل في يومين ، سحبت جميع الملفات من هناك وأعدت النظام.


الخلفية


بعد عامين من الجلوس على أنظمة nix ، وخاصة على خادم ubuntu (16.04 LTS) ، قررت تجربة المحاكاة الافتراضية. نصح صديق ESXi كحل مجاني للخوادم الصغيرة (حالتي: معالج واحد + 8 غيغابايت فقط من ذاكرة الوصول العشوائي). كانت عملية النقل معقدة بسبب حقيقة أنه كان عليك أولاً رفع محطة عمل vmware باستخدام محول vmware على كمبيوتر Windows ، ونقل النظام النهائي هناك ، ثم رفعه على خادم esxi وبعد أن يقوم المحول المألوف بنقل النظام إلى esxi. هذه رحلة طويلة ومؤلمة. الخطأ الرئيسي أثناء النقل ، الذي قمت به والذي لا يزال يظهر علي ، هو أنني استخدمت قرصًا رفيعًا. وهذا يعني ، لكوني على خادم أوبونتو نظيف مع قرص مهيأ في exfat-4 ، كان لدي مساحة 223.8 جيجا بايت على SSD. بالانتقال إلى esxi وتنسيق القرص إلى تنسيق غير مفهوم لأي شيء ، فقدت 300 ميغابايت فقط ، ولكن بسببها لم أتمكن من إنشاء قرص سميك ، والذي (بعد ذلك تبين لاحقًا) كان بحاجة إلى الكثير.


ابدأ


اعتدت على كسر الحطب باستخدام خادم أوبونتو (عندما "درسته" للتو) ، وأتراجع وأعيد تثبيت النظام مرة واحدة في الشهر أو شهرين. الآن أنا كسر الحطب مع ESXi. أعتقد أنه ليست هناك حاجة لوصف مشكلة الأقراص الرقيقة (باختصار ، بعد توسيع مساحتها فإنها لا "تضيق" في الاتجاه المعاكس. يمكنها أيضًا تجاوز المقدار الفعلي للذاكرة على القرص). أولاً ، استخدمت المبادلة على نفس محرك الأقراص ssd دون إعداده بشكل صحيح في ESXi. لقد أكل ذاكرة ، وكتب بعض الملفات المؤقتة هناك ، ونمت في غضون ذلك.
ثانيًا ، لسبب ما ، قمت بعمل لقطات. في تلك اللحظة استرشدت بحقيقة "حسنًا ، إنها مريحة وسريعة وكل ذلك". ما زلت لا أشك في نوع الكيس وما القنبلة البطيئة التي زرعوها لي. ثالثًا ، لم أتبع حجم الذاكرة المتناقص بسرعة على القرص.


الصورة


تعادل


الجرس الأول كان توقف السيارة الرئيسية في 17 يوليو. وصل إشعار في البريد حول سقوط المضيف. بالذهاب إلى esxi لالتقاطها (حسنًا ، فجأة قد يحدث شيء ما) ، أعطتني الفتاة الافتراضية أخبارًا سارة (لا توجد لقطة شاشة ، للأسف). كان إعادة سرد مجانية للنافذة المنبثقة شيء مثل "عذرًا ، لقد نفدت مساحة القرص. تم إيقاف جهازك الظاهري. نظف المكان ويمكنك الاستمرار في استخدام VM. كرر إلغاء. في ذلك الوقت ، تم حل المشكلة عن طريق إزالة VM الثاني ، الذي استغرق حوالي 16 جيجابايت. لكن هذا كان حلاً مؤقتًا ، لأنه كل يوم ، لا يزال 5 جيجابايت يختفي في مكان ما ، على الرغم من أن النظام لم يكن لديه زيادة في هذه الملفات.


نتيجة لذلك ، في مساء يوم 19 يوليو ، في يوم الخميس البارد ، كتبت لأول مرة على محمصة الخبز حول هذه المشكلة. لم يكن هناك إجابة. أعتقد أن هذا يرجع إلى علامة esxi غير الشعبية. بعد ذهب جوجل غير ناجحة ، بعد - إزالة اللقطات. في تلك اللحظة ، اختفى 5 غيغابايت ، وأصبحت المساحة الحرة أكبر ، ولكن ليس بقدر نسيان هذه المشكلة.


الصورة


بعد ذلك ، مع القليل من المخ ، بدأت في دراسة التسلسل الهرمي للقطات. آخر واحد ، 000003 ، كان يشغل مساحة 12 جيجابايت في ذلك الوقت. في إعدادات VM ، تم إدراجه كملف قرص نشط تم تمهيد الجهاز منه. دون التفكير مرتين ، قمت بحذف ملف القرص الثابت 1 مع قرص اللقطة النشط وأدرجت القرص الأصلي للجهاز الظاهري بأكمله في مكانه.


الصورة


قام النظام بالتمهيد (هتاف) ومعه ملفات 30 يونيو. تاريخ آخر تعديل لجميع الملفات الموجودة على القرص الأصلي. أظن أنه في هذا اليوم أنشأت أول لقطة. منطقيا ، لم يعد هناك أماكن. في المساحة الحرة ، لا يزال حجمها حوالي 5 جيجابايت ، وتختفي الملفات.


الأفكار الأولى منطقية: ما فعلته ، تبخرت جميع الملفات حتى 19 يوليو. ثم رأيت أنه لم يتم حذف ملفات اللقطة. ومع ذلك ، عندما حاولت تحميلها كقرص رئيسي ، أقسم ESXi على القرص الرئيسي الذي تم تغييره ، والذي لا ينبغي أن يكون "تم تعديل القرص الظاهري الأصلي منذ إنشاء الطفل" خطأ أبدي على مدار اليومين التاليين.


جوجل


كان الوقت يقترب الساعة الثانية صباحا ، وتخلت عن كل محاولات عبثية على الأقل للحصول على بعض المعلومات من هذه الملفات المؤلمة * -0000؟ - ملفات لقطة فمك.


بدأ صباح الجمعة بجوجل نشط ونشط حقًا مثل "كيفية الحصول على الملفات من vmdk". مقالات وقارئ لينكس (برنامج ويندوز) وكل ما يأتي في كثير من الأحيان. لقد نقلت 223 غيغابايت من الخادم إلى جهاز الكمبيوتر المحمول الذي يعمل بنظام windows على قناة 100 ميجابت ، وهو أمر مؤلم للغاية. حاولت تحميل قرص ssd بتنسيق vmware على نظام لينكس ، وأطفت عليه أدوات vmware ، أقسمت على عدم توافق الإصدارات (كان آخر نسخة مدعومة 5 ، لكن كان لدي 6.5). كما كانت محاولات فتح النوافذ والجافا غير مجدية.


وحتى بعد أن تمكنت من الوصول إلى ملف * -flat.vmdk (باستخدام برنامج قارئ Linux على النوافذ) ، تلقيت الملفات فقط حتى 30 يونيو. لم تسفر كل المحاولات الإضافية لتحميل ملفات اللقطة عن شيء ، ولعن البرنامج على قرص غير صالح ورفض العمل أكثر.


تم العثور على الإخراج


انتهى يوم الجمعة ، لقد استنفدت ، وأزعجت أيضًا أنه لا يمكن إرجاع الملفات. لكن يوم السبت بدأ بنجاح. على أخطاء جوجل (لماذا لم أفعل ذلك على الفور غير معروف) "تم تعديل القرص الظاهري الرئيسي منذ إنشاء الطفل" في السطر الأول من Google أعطى رابطًا إلى صفحة برنامج vmware. حفنة من الشخصيات المخيفة والخطوط الحمراء وكل ما كان خائفا على الفور. فتحت الرابط وتركته على أمل أن أجد شيئًا أكثر قابلية للفهم.


وقد وجد. https://communities.vmware.com/thread/323730 قابلني منتدى VmWare باللغة الروسية ومشكلة مماثلة على الإنترنت. ربما هذه ليست نفس حالتي ، ولكن بعد التمرير لأسفل وقراءة التعليقات ، حاولت القيام بذلك.


في محرر نصي ، اتصل بـ esxi عبر sftp ، فتحت الملف بإعدادات القرص الأصل. .vmdk (not -flat.vmdk) تعرفت على الرقم التعريفي للعميل الخاص بالقرص ، ثم صعدت إلى * -00001.vmdk ، كما هو موضح من قبل الشخص الذي يحمل لقب apavlyuchenko في المنتدى.


في اللقطة الأولى ، يجب أن يشير حقلي CID و motherCID إلى CID للقرص الأصلي. ثم في ملف .vmx في الحقول
scsi0: 1.present = "false"
scsi0: 1.fileName = " .vmdk"
scsi0: 1.deviceType = "scsi-hardDisk"
تغيير المعلمة FALSE إلى TRUE و. vmdk إلى -00001.vmdk.


وبالفعل ، بعد ذلك ، انطلقت السيارة ولم تقسم على الخطأ. وها وها! ظهرت الملفات قبل إنشاء لقطة ثانية!


في المنتدى ، وصف أحد الأصدقاء طريقة لاستعادة الملفات من لقطة واحدة فقط. لكن حالتي صعبة (على ما يبدو ، بسبب مرضي ، وهو ما يسمى "كزة كل شيء بيديك على آلة عمل"). ولم يكن لدي لقطة واحدة ، بل ثلاث. وهو أمر منطقي ، كان من الضروري الاستمرار في تغيير الملفات.


لذلك ، أفعالي.


افتح القرص الأصلي. اكتشف الرقم التعريفي للعميل الخاص به. بعد ذلك ، انسخ CID للقرص الأصلي إلى سطر CID الأصل للقرص -00001.vmdk (اللقطة الأولى). هناك ننظر إلى الرقم التعريفي للعميل (CID) لهذه اللقطة وننسخها إلى سطر الأصل CID لمحرك الأقراص -00002.vmdk (اللقطة الثانية). هناك ننظر إلى الرقم التعريفي للعميل الخاص بهذه اللقطة ونقوم بنسخها في سطر الأصل CID لمحرك الأقراص -00003.vmdk (اللقطة الثالثة) ، حسنًا ، بعد ذلك نتسلق إلى .vmx ونشير إلى اسم ملف اللقطة في سطر fileName (في حالتي * -0003.vmdk)


والنتيجة هي ما يلي.


* .vmdk
CID = 387 فدان
motherCID = ffffffff


* -00001.vmdk
CID = 0284jf712 (أخذت جميع CIDs من الغامق)
الأصل CID = 387 فدان


* -00002.vmdk
CID = 732fhhtud
الأصل CID = 0284jf712


* -00003.vmdk
الرقم التعريفي للعميل = 3747jfj4ff
CID = 732fhtud


.vmx
scsi0: 1.present = "true"
scsi0: 1.fileName = " -00003.vmdk"
scsi0: 1.deviceType = "scsi-hardDisk"


أنتقل على VM ، أرى أن البيانات يتم استعادتها. يبدو أن ترك. أقوم بنسخ كل شيء إلى خادم آخر ، وأوقف الجهاز (وهو يصرخ بالفعل حول أعطال القرص وبعض المشاكل الحرجة الأخرى) ، وأعيد إعدادات * .vmx مرة أخرى ونسخ الملفات مرة أخرى إلى جهاز العمل. مرحى.


الخلاصة


علمتني هذه القصة عدة حقائق ذهبية لم يكن من الممكن فهمها من قبل.


أولاً ، قم بعمل نسخة احتياطية لكل شيء دائمًا وفي كل مكان وليس على القرص داخل الجهاز الظاهري ، كما فعلت من قبل. من الضروري أن يكون لديك محرك أقراص احتياطي واحد ، أو حتى محركي نسخ احتياطي ، حتى لا يكون هناك فترة توقف لمدة يومين. (هل اختفت الملفات؟ نحن نعود وننسخ الملفات من النسخة الاحتياطية والبسيطة - ليس 48 ساعة ، ولكن ساعتين من القوة) ثانيًا ، لا أفعل شيئًا على رأسي الثقيل في الواحدة صباحًا (إذا ذهبت إلى الفراش ، فسأحضر برأس نظيف يوم الجمعة إلى مخرج آخر ، ولكن لم يكسر الحطب في الساعة الثانية من الليل) ثالثًا ، لا تقم بإجراء أي تعديلات مهمة على آلات العمل. انطلق من الجهاز الظاهري الثاني ، وقم بعمل لقطة هناك ، ثم اجعل محرك الأقراص الرئيسي هو المحرك الرئيسي وانظر ماذا يحدث بعد ذلك - هذه هي الطريقة التي تم بها ذلك. ورابعاً ، قم بعمل نسخ احتياطية أكثر. ليس فقط VM ، ولكن esxi نفسها ككل.


موارد PS التي ساعدتني أخيرًا:


نفس المنتدى مع apavlyuchenko المذهل (نحن لسنا مألوفين ، إذا كان ذلك)


صفحة على قاعدة المعرفة من vmvara مع وصف لمشكلتي وطرق حلها


الصورة التي استخدمتها


إذا كان أي شخص مهتمًا ، في التعليقات ، يمكنني ترك تلك الموارد التي لم تساعدني مقالاتها


Pss


لسوء الحظ ، لا تزال مشكلة اختفاء المكان ذات صلة. إذا كان لديك أفكار أو رغبة لمساعدتي في التعامل مع هذا ، يرجى التعليق. يمكننا التحدث عن ذلك هناك. أو إذا كنت تعرف طريقة أخرى لاستعادة الملفات من أقراص اللقطات وترغب أيضًا في مشاركتها ، فسأكون مهتمًا بقراءتها. شكرا لك

Source: https://habr.com/ru/post/ar418049/


All Articles