مرحبا مرة اخرى تم إعداد ترجمة للمقالة التالية خاصة للطلاب في دورة
Linux Administrator . دعنا نذهب!

ما هو سمارت؟
SMART
(تعني تقنية المراقبة الذاتية والتحليل وإعداد التقارير) هي تقنية مضمنة في محركات الأقراص مثل محركات الأقراص الثابتة أو محركات أقراص الحالة الصلبة. مهمتها الرئيسية هي مراقبة الحالة.
في الواقع ، يتحكم SMART في العديد من المعلمات أثناء عمليات القرص العادية. يراقب معلمات مثل عدد أخطاء القراءة ، ووقت بدء تشغيل القرص ، وحتى حالة البيئة. بالإضافة إلى ذلك ، يمكن لـ SMART أيضًا إجراء الاختبارات باستخدام محرك الأقراص.
من الناحية المثالية ، سوف تتنبأ SMART بالفشل المتوقع ، مثل الأعطال الناجمة عن التآكل الميكانيكي أو تدهور سطح القرص ، وكذلك الأعطال غير المتوقعة الناتجة عن أي عيب غير متوقع. نظرًا لأن الأقراص لا تفشل عادةً بشكل مفاجئ ، فإن SMART تساعد نظام التشغيل أو مسؤول النظام في تحديد تلك الأقراص التي ستفشل قريبًا حتى يمكن استبدالها وتجنب فقدان البيانات.
ما لا ينطبق على سمارت؟
كل هذا ، بالطبع ، رائع. ومع ذلك ، سمارت ليست كرة بلورية. لا يمكنه التنبؤ بالفشل مع الاحتمال المطلق ولا يمكنه ضمان أن محرك الأقراص لن يفشل دون سابق إنذار. في أفضل الأحوال ، يجب استخدام SMART لتقييم احتمال حدوث انهيار.
نظرًا للطبيعة الإحصائية للتنبؤ بالفشل ، تهتم تقنية SMART بشكل خاص بالشركات التي تستخدم عددًا كبيرًا من أجهزة التخزين. من أجل معرفة مدى دقة SMART في التنبؤ بالفشل والإبلاغ عن الحاجة إلى استبدال الأقراص في مراكز البيانات أو أجهزة الخادم المركزية ، فقد أجريت حتى دراسات خاصة.
في عام 2016 ، أجرت Microsoft وجامعة بنسلفانيا دراسة تتعلق
بمحركات أقراص الحالة الصلبة .
وفقًا لهذه الدراسة ، تُعتبر بعض سمات SMART مؤشرات جيدة لحتمية الفشل. على وجه الخصوص ، يذكر المقال:
إعادة تخصيص القطاعات :
على الرغم من حقيقة أن التقنيات الأساسية تختلف اختلافًا جذريًا ، إلا أن هذا المؤشر لا يزال مطلوبًا في كل من عالم محركات الأقراص ذات الحالة الصلبة وفي عالم محركات الأقراص الصلبة. تجدر الإشارة إلى أنه نظرًا لميزات خوارزميات موازنة التآكل المستخدمة في محركات أقراص الحالة الصلبة (SSD) ، عندما تفشل العديد من القطاعات ، ثم مع احتمال كبير ، يمكننا أن نفترض أن عددًا أكبر سيفشل قريبًا.
الأخطاء في حلقة برنامج / محو (P / E):هذه علامة على وجود مشاكل في معدات ذاكرة الفلاش الرئيسية المتعلقة بحقيقة أن القرص لا يمكنه حذف البيانات من الكتلة أو حفظها هناك. الحقيقة هي أن عملية الإنتاج غير كاملة ، لذلك يمكن توقع ظهور مثل هذه الأخطاء. ومع ذلك ، تحتوي ذاكرة الفلاش على عدد محدود من دورات الكتابة / الحذف. لهذا السبب ، قد تشير الزيادة المفاجئة في عدد الأحداث إلى أن القرص وصل إلى الحد الأقصى ، ومن المتوقع أن تبدأ خلايا الذاكرة الأخرى في الفشل.
CRC والأخطاء المميتة ("خطأ البيانات"):يمكن أن يكون سبب الأحداث من هذا النوع أخطاء التخزين أو مشاكل في قناة الاتصال الداخلية لمحرك الأقراص. يأخذ هذا المؤشر في الاعتبار كل من الأخطاء التي تم تصحيحها (تم الإبلاغ عنها إلى النظام المضيف دون أي مشاكل) والأخطاء غير المصححة (بسبب إغلاق القرص ، والتي أبلغت النظام المضيف عن استحالة القراءة). بمعنى آخر ، الأخطاء المصححة غير مرئية لنظام التشغيل ، ومع ذلك ، فهي تؤثر على أداء محرك الأقراص ، مما يزيد من احتمال إعادة تعيين القطاع.
SATA downshift count:نظرًا للتداخل المؤقت أو مشكلات قناة الاتصال بين محرك الأقراص والمضيف أو بسبب مشاكل داخلية في محرك الأقراص ، فقد تتحول واجهة SATA إلى سرعة إرسال إشارة أقل. إن خفض سرعة الاتصال إلى ما دون المستوى الاسمي له تأثير واضح على أداء القرص. وبالتالي ، فإن هذا المؤشر هو الأكثر أهمية ، لا سيما عندما يرتبط مع وجود واحد أو أكثر من المؤشرات السابقة.
وفقا للدراسة ، أظهرت 62 ٪ من SSDs الفاشلة وجود واحد على الأقل من الأعراض المذكورة أعلاه. من ناحية أخرى ، يمكننا القول أن 38٪ من محركات الأقراص التي تمت دراستها قد فشلت دون الإشارة إلى هذه الأعراض. لم تذكر الدراسات ما إذا كانت هناك أي تقارير أخرى عن رفض SMART بسبب "الأعراض" الأخرى. لهذا السبب ، لا يمكنك ربط هذه القيم بالفشل مباشرةً دون سابق إنذار في 36٪ من الحالات من مقال من Google.
لم تكشف دراسة أجرتها شركة Microsoft وجامعة بنسلفانيا عن نموذج قرص الاختبار ، ولكن وفقًا للمؤلفين ، فإن معظم الأقراص جاءت من نفس المورد لعدة أجيال.
كما لاحظت الدراسة اختلافات كبيرة في الموثوقية بين النماذج المختلفة. على سبيل المثال ، يُظهر نموذج "الأسوأ" الذي تمت دراسته معدل عطل يبلغ 20 بالمائة بعد 9 أشهر من خطأ إعادة التعيين الأول وما يصل إلى 36 بالمائة من حالات الفشل خلال 9 أشهر بعد حدوث أخطاء البيانات لأول مرة. كان يسمى النموذج "الأسوأ" الجيل الأقدم من الأقراص التي تم بحثها في المقال.
من ناحية أخرى ، مع نفس الأعراض المذكورة أعلاه ، فشل الجيل الجديد من محركات الأقراص بنسبة 3 ٪ و 20 ٪ وفقا لنفس الأخطاء. من الصعب القول ما إذا كان يمكن تفسير هذه الأرقام بتحسين تصميم محرك الأقراص وعملية الإنتاج ، أو ما إذا كان تأثير التقادم يلعب دورًا هنا.
الشيء الأكثر إثارة للاهتمام المذكور في المقالة (كتبت عن هذا سابقًا) هو أن زيادة عدد الأخطاء المسجلة يمكن أن يحدث كمؤشر ينذر بالخطر:
"هناك احتمال كبير للأعراض التي تسبق فشل محركات أقراص الحالة الصلبة ، والتي تظهر بنشاط وتتقدم بسرعة ، مما يقلل بشكل كبير من وقت حياة محرك الأقراص إلى عدة أشهر."
بمعنى آخر ، لا ينبغي بالتأكيد اعتبار الخطأ العشوائي الذي أبلغت عنه SMART إشارة إلى الفشل الوشيك. ومع ذلك ، عندما يبدأ SSD صحي في الإبلاغ عن المزيد والمزيد من الأخطاء ، يجب أن تتوقع حدوث فشل قصير الأجل أو متوسط.ولكن كيف يمكنك أن تعرف ما هي الحالة SSD الخاص بك هو الآن في؟ لإرضاء فضولك ، أو بدافع الرغبة في البدء في مراقبة محركات الأقراص عن كثب ، يمكنك استخدام
smartctl
مراقبة
smartctl
.
استخدام smartctl
لمراقبة حالة SSD على نظام Linux
لمراقبة حالة SMART لمحرك الأقراص الخاص بك ، أقترح استخدام أداة
smartctl
، التي تعد جزءًا من حزمة
smartmontool
(على الأقل في Debian / Ubuntu).
sudo apt install smartmontools
smartctl
هي
أداة لسطر الأوامر ، لكنها تساعد بشكل خاص في الحالات التي تحتاج فيها إلى أتمتة عملية جمع البيانات ، على سبيل المثال ، من الخوادم الخاصة بك.
smartctl
الخطوة الأولى في استخدام
smartctl
في التحقق لمعرفة ما إذا كان محرك الأقراص يحتوي على SMART ويدعمه الأداة:
sh$ sudo smartctl -i /dev/sdb smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Seagate Momentus 7200.4 Device Model: ST9500420AS Serial Number: 5VJAS7FL LU WWN Device Id: 5 000c50 02fa0b800 Firmware Version: D005SDM1 User Capacity: 500,107,862,016 bytes [500 GB] Sector Size: 512 bytes logical/physical Rotation Rate: 7200 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ATA8-ACS T13/1699-D revision 4 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Mar 12 15:54:43 2018 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled
كما ترون ، فإن القرص الصلب الداخلي لجهاز الكمبيوتر المحمول يدعم SMART بالفعل وأنه قيد التشغيل. إذن ، كيف تحصل على وضع SMART الآن؟ هل هناك أي أخطاء ثابتة؟
يعد الإبلاغ "حول جميع معلومات قرص SMART" هو الخيار
-a
:
sh$ sudo smartctl -i -a /dev/sdb smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Seagate Momentus 7200.4 Device Model: ST9500420AS Serial Number: 5VJAS7FL LU WWN Device Id: 5 000c50 02fa0b800 Firmware Version: D005SDM1 User Capacity: 500,107,862,016 bytes [500 GB] Sector Size: 512 bytes logical/physical Rotation Rate: 7200 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ATA8-ACS T13/1699-D revision 4 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Mar 12 15:56:58 2018 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED See vendor-specific Attribute list for marginal Attributes. General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 0) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 110) minutes. Conveyance self-test routine recommended polling time: ( 3) minutes. SCT capabilities: (0x103f) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID
فهم إخراج أوامر smartctl
الإخراج هو الكثير من المعلومات التي ليست دائما سهلة الفهم. ربما يكون الجزء الأكثر إثارة للاهتمام هو الجزء المسمى "سمات SMART الخاصة بالموردين ذات العتبات". يُبلغ عن العديد من الإحصاءات التي تم جمعها بواسطة جهاز SMART ويسمح لك بمقارنة هذه القيم (الحالية أو الأسوأ في كل الأوقات) مع حد معين يحدده المورد.
على سبيل المثال ، فيما يلي تقاريري حول القطاعات المعاد تعيينها على القرص:
ID
قد تلاحظ سمة
"ما قبل الفشل" . وهذا يعني أن القيمة غير طبيعية. وبالتالي ، إذا تجاوزت القيمة العتبة ، يكون احتمال الفشل مرتفعًا.
يتم استخدام فئة أخرى من
"Old_age" للسمات التي تتوافق مع قيم "البلى العادي".
يتوافق الحقل الأخير (هنا بقيمة "3") مع قيمة السمة الأصلية التي يبلغ عنها محرك الأقراص. عادة ما يكون لهذا الرقم معنى مادي. هنا هو العدد الفعلي للقطاعات المعاد تخصيصها. بالنسبة للسمات الأخرى ، قد تكون درجة الحرارة بالدرجات المئوية أو الوقت بالساعات أو الدقائق أو عدد المرات التي تم فيها استيفاء شرط معين للقرص.
بالإضافة إلى القيمة الأولية ، يجب على محرك الأقراص الذي يدعم SMART الإبلاغ عن "القيم الطبيعية" (قيم الحقول ، الأسوأ والعتبة). يتم تطبيع هذه القيم في حدود 1-254 (0-255 لقيم العتبة). تنفذ البرامج الثابتة للقرص هذا التطبيع باستخدام بعض الخوارزمية الداخلية. بالإضافة إلى ذلك ، يمكن أن تقوم الشركات المصنعة المختلفة بتطبيع نفس السمة بطرق مختلفة. يتم تقديم معظم القيم كنسبة مئوية ، وكلما كان ذلك أفضل ، ولكن هذا ليس هو الحال دائمًا. عندما تكون المعلمة أقل من أو تساوي قيمة العتبة المحددة من قبل الشركة المصنعة ، يعتبر القرص معيبًا من حيث هذه السمة. مع الأخذ في الاعتبار جميع الإرشادات الواردة في الجزء الأول من المقالة ، عندما لا تزال السمة التي تظهر قيمة
"ما قبل الفشل" قد فشلت ، فمن المرجح أن القرص سوف يفشل قريبًا.
كمثال ثانٍ ، خذ
"طلب معدل الخطأ" :
ID
في الواقع (وهذه هي المشكلة الرئيسية في إعداد تقارير SMART) ، يفهم المزود فقط القيمة الدقيقة لحقول كل سمة. في حالتي ، تستخدم Seagate مقياس لوغاريتمي لتطبيع القيمة. وبالتالي ، فإن "71" تعني خطأ واحدًا تقريبًا لكل 10 ملايين طلب (10 إلى 7.1). من المضحك أن أسوأ مؤشر على الإطلاق كان خطأ واحد لكل مليون طلب (10 إلى 6 درجات).
إذا فهمت بشكل صحيح ، فهذا يعني أن رؤوس قرصي أصبحت الآن أكثر دقة من ذي قبل. لم أراقب هذا القرص عن كثب ، لذلك قمت بتحليل البيانات التي تم الحصول عليها بشكل شخصي للغاية. ربما كان على محرك الأقراص فقط "الركض" قليلاً منذ تشغيله؟ أو ربما هذا هو نتيجة للتآكل الميكانيكي للأجزاء ، وبالتالي ، هناك الآن أقل احتكاك؟ في أي حال ، أيا كان السبب ، فإن هذه القيمة هي مقياس للأداء أكثر من كونها إنذارًا مبكرًا بوجود خطأ. لذلك لا يزعجني كثيرًا.
بالإضافة إلى ما ورد أعلاه وثلاثة أخطاء مشبوهة للغاية تم تسجيلها منذ حوالي ستة أشهر ، فإن هذا القرص في حالة جيدة بشكل مدهش (وفقًا لـ SMART) بالنسبة لقرص مخزون الكمبيوتر المحمول ، والذي عمل لأكثر من 1100 يومًا (26423 ساعة).
ID
بدافع الفضول ، قمت بإجراء نفس الاختبار على كمبيوتر محمول أحدث بكثير مجهز بـ SSD:
sh$ sudo smartctl -i /dev/sdb smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Device Model: TOSHIBA THNSNK256GVN8 Serial Number: 17FS131LTNLV LU WWN Device Id: 5 00080d 9109b2ceb Firmware Version: K8XA4103 User Capacity: 256 060 514 304 bytes [256 GB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: Solid State Device Form Factor: M.2 Device is: Not in smartctl database [for details use: -P showall] ATA Version is: ACS-3 (minor revision not indicated) SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Tue Mar 13 01:03:23 2018 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled
أول ما يلفت
smartctl
هو أنه على الرغم من وجود SMART ، فإن الجهاز ليس في قاعدة بيانات
smartctl
. لكن هذا لن يمنع الأداة من جمع البيانات من SSD ، ومع ذلك ، فلن تكون قادرة على الإبلاغ عن القيم الدقيقة للسمات المختلفة المحددة للمزود:
sh$ sudo smartctl -a /dev/sdb smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 120) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 11) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID
فوق ترى ناتج SSD العلامة التجارية الجديدة. البيانات مفهومة حتى في غياب التطبيع أو المعلومات الوصفية لبيانات موفر معين ، كما في حالتي مع
"Unknown_SSD_Attribute." لا يسعني إلا أن آمل أن تحتوي الإصدارات المستقبلية من
smartctl
على بيانات حول نموذج محرك الأقراص هذا في قاعدة البيانات ، ويمكنني تحديد المشكلات المحتملة بشكل أفضل.
اختبار SSD الخاص بك على لينكس مع smartctl
حتى الآن ، قمنا بمراجعة البيانات التي تم جمعها أثناء تشغيل محرك الأقراص العادي. ومع ذلك ، يدعم بروتوكول SMART أيضًا العديد من الأوامر للاختبار دون اتصال لتشغيل التشخيصات عند الطلب.
يمكن إجراء الاختبار دون اتصال أثناء عمليات القرص العادية ، ما لم ينص على خلاف ذلك. بسبب تنافس الاختبار وطلبات الإدخال / الإخراج المضيف ، سيتم إسقاط أداء القرص أثناء الاختبار. تحدد مواصفات SMART عدة أنواع من الاختبارات المستقلة:
اختبار قصير قائم بذاته ( -t short
)سوف يتحقق هذا الاختبار من الأداء الكهربائي والميكانيكي ، وكذلك أداء قراءة القرص. عادة ما يستغرق الاختبار الذاتي القصير بضع دقائق فقط (عادة من 2 إلى 10).
اختبار مستقل ممتد ( -t long
)هذا الاختبار يستغرق ما يقرب من ضعف الوقت. هذا عادة ما يكون مجرد نسخة أكثر تفصيلاً من اختبار قائم بذاته قصير. بالإضافة إلى ذلك ، سيقوم هذا الاختبار بمسح كامل سطح القرص بحثًا عن أخطاء البيانات دون حد زمني. ستكون مدة الاختبار متناسبة مع حجم القرص.
اختبار الشحن المستقل ( -t conveyance
)يُقترح طقم الاختبار هذا كوسيلة سريعة نسبيًا للتحقق من التلف المحتمل الذي حدث أثناء نقل الجهاز.
فيما يلي أمثلة مأخوذة من نفس محركات الأقراص التي كانت أعلاه. أقترح عليك أن تخمن أي واحد:
sh$ sudo smartctl -t short /dev/sdb smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Short self-test routine immediately in off-line mode". Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 2 minutes for test to complete. Test will complete after Mon Mar 12 18:06:17 2018 Use smartctl -X to abort test.
الاختيار قيد التقدم. دعنا ننتظر حتى تكتمل لمعرفة النتيجة:
sh$ sudo sh -c 'sleep 120 && smartctl -l selftest /dev/sdb' smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-32-generic] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
دعنا نجري نفس الاختبار على محرك أقراص آخر:
sh$ sudo smartctl -t short /dev/sdb smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Short self-test routine immediately in off-line mode". Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 2 minutes for test to complete. Test will complete after Mon Mar 12 21:59:39 2018 Use smartctl -X to abort test.
ومرة أخرى ، سنرسله للنوم لمدة دقيقتين ونرى النتيجة:
sh$ sudo sh -c 'sleep 120 && smartctl -l selftest /dev/sdb' smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
ومن المثير للاهتمام ، في هذه الحالة ، نرى أن الشركات المصنعة للقرص والكمبيوتر يبدو أنهما قاما بالفعل باختبار القرص (في فترة حياة تبلغ 0 ساعة و 12 ساعة). أنا نفسي بالتأكيد أقل قلقًا بشأن حالة محرك الأقراص مما هي عليه. لذا ، نظرًا لأنني سبق أن أظهرت اختبارات سريعة ، فسأجري الاختبار المتقدم أيضًا لأرى كيف يحدث ذلك.
sh$ sudo smartctl -t long /dev/sdb smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Extended self-test routine immediately in off-line mode". Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 110 minutes for test to complete. Test will complete after Tue Mar 13 00:09:08 2018 Use smartctl -X to abort test.
على ما يبدو ، هذه المرة سيستغرق الانتظار وقتًا أطول بكثير من الانتظار خلال اختبار قصير. لذلك دعونا نرى:
sh$ sudo bash -c 'sleep $((110*60)) && smartctl -l selftest /dev/sdb' [sudo] password for sylvain: smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
في الاختبار الأخير ، انتبه إلى الفرق في النتائج التي تم الحصول عليها باستخدام الاختبارات القصيرة والممتدة ، حتى لو تم إجراؤها واحدة تلو الأخرى. حسنا ، ربما هذا القرص ليس في مثل هذه الحالة الجيدة! ألاحظ أن الاختبار توقف بعد خطأ القراءة الأول. لذلك ، إذا كنت ترغب في الحصول على معلومات شاملة حول جميع أخطاء القراءة ، فسيتعين عليك متابعة الاختبار بعد كل خطأ. إنني أحثك على إلقاء نظرة على صفحة دليل ذكية مكتوبة بشكل جيد للغاية (8) لمزيد من المعلومات حول
-t select
و
N-max
و
-t select
لتتمكن من القيام بذلك:
sh$ sudo smartctl -t select,810665230-max /dev/sdb smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Selective self-test routine immediately in off-line mode". SPAN STARTING_LBA ENDING_LBA 0 810665230 976773167 Drive command "Execute SMART Selective self-test routine immediately in off-line mode" successful. Testing has begun.
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
استنتاج
بالتأكيد ، SMART هي بالضبط التكنولوجيا التي يجب إضافتها إلى مجموعة أدواتك لمراقبة صحة محركات أقراص الخادم لديك.
SMART Disk Monitoring Daemon smartd(8) ,
.
, , SMART . , , – , , . , RAID !
, !