Apakah komputer Anda dapat diandalkan?

Saya sajikan kepada Anda terjemahan sebuah artikel oleh Jeff Atwood tentang pengujian komputer baru. Saya belum melihat satu artikel pun dari kualitas ini tentang hal ini; artikel ini menyediakan semua informasi yang diperlukan dan tidak lebih, serta materi yang terstruktur dengan baik. Saya harap Anda juga menyukainya.

Jeff adalah pendiri StackOverflow . Dia saat ini sedang mengerjakan proyek Wacana .

Artikel asli: Apakah Komputer Anda Stabil?

Penafian: Meskipun artikel berjudul " Apakah komputer Anda dapat diandalkan ?", Ini bukan tentang keandalan sebagai istilah (keandalan bahasa Inggris), tetapi lebih tentang stabilitas (stabilitas bahasa Inggris). Artikel tentang bagaimana penulis menguji komputer baru untuk stabilitas dan daya tahan.


Jika ingatan saya benar, saya telah mengumpulkan sekitar seratus komputer selama dua puluh tahun terakhir. Ini tidak begitu sulit dan, pada kenyataannya, itu hanya semakin mudah seiring waktu, karena komputer menjadi semakin kompatibel.

Misalnya, inilah yang mungkin Anda perlukan untuk membangun Scooter Computer :

  1. Oleskan sedikit pasta termal ke bagian atas kasing.
  2. Tempatkan motherboard dalam kasing.
  3. Pasang motherboard ke kasingnya.
  4. Masukkan kartu SSD.
  5. Masukkan papan RAM.
  6. Hubungkan daya eksternal.
  7. Boot.

Itu saja.



Ini sangat sederhana. Putra saya yang berusia enam tahun dan saya mengumpulkan konstruktor Lego, yang jauh lebih rumit. Perakitan PC tradisional berbeda hanya dalam beberapa langkah tambahan: masukkan prosesor, heatsink, kabel koneksi. Dan akhirnya, membangun server menambahkan beberapa tindakan kecil, mungkin dengan batasan ukuran perakitan. Komputer mini, PC biasa atau server - jika Anda dapat merakitnya - pertimbangkan Anda telah mengumpulkan semuanya.

Masing-masing dari kita menghembuskan napas lega ketika komputer baru saja memasang sepatu boot untuk pertama kalinya, dan tidak masalah berapa banyak mesin yang Anda miliki di akun Anda. Tetapi pengunduhan hanyalah awal. Ini bagus jika boot, tetapi Anda tidak akan mengejutkan siapa pun. Padahal, kita perlu tahu apakah komputer ini dapat diandalkan .

Dan meskipun komponen komputer menjadi lebih andal setiap tahun , dan pabrikan melakukan banyak pengujian sebelum pengiriman, tidak ada jaminan bahwa semua bagian akan bekerja dengan andal bersama, di lingkungan Anda. Dan selalu ada kemungkinan Anda akan menemukan suku cadang dengan cacat internal yang sulit dipahami - bahkan jika probabilitas ini sangat kecil.

Karena kami adalah ilmuwan, kami menguji berbagai hal dalam kondisi yang tepat dan mengumpulkan data untuk membuktikan bahwa komputer kami berfungsi dengan stabil . Karena itu, setelah memuat kami memulai tes.

Memori


Saya suka memulai dengan pengujian memori, karena tidak harus memiliki OS yang diinstal dan bekerja sama pada semua komputer x86. Memtest86 adalah "kakek buyut" dari semua penguji memori. Saya tidak yakin mengapa dia dan Memtest86 + berpisah, tetapi mereka bekerja hampir sama. PassMark adalah versi yang lebih baru, itulah sebabnya saya merekomendasikannya .

Unduh versi yang sesuai dengan Anda, tulis di flash drive USB yang dapat di-boot, masukkan ke komputer baru, boot dan biarkan program melakukan tugasnya. Semuanya berfungsi dalam mode otomatis - cukup booting dan lihat bagaimana tes berjalan.

gambar
(jika komputer Anda mendukung boot UEFI, versi 6.x yang lebih baru akan tersedia untuk Anda, dalam kasus lain - versi 4.2, yang ditunjukkan pada tangkapan layar).

Saya sarankan setidaknya satu pas memtest penuh , dan jika Anda perlu yakin dengan stabilitas komputer Anda, biarkan diuji dalam semalam. Jika Anda memiliki banyak memori, bersabarlah. Untuk server kami dengan memori 128GB, pengujian membutuhkan waktu sekitar 3 jam.

Nilai "Lulus" di bagian atas layar harus mencapai 100%, dan nilai "Lulus" di tabel harus lebih dari satu. Jika Anda mendapatkan kesalahan, dan tentu saja tidak ada tanda bersih 100% - komputer Anda tidak dapat diandalkan . Dalam hal ini, ada baiknya mulai mengeluarkan kartu memori untuk mendeteksi yang salah.

Sistem operasi


Semua tes selanjutnya akan membutuhkan OS yang diinstal, dan yang paling penting dari semua tes reliabilitas adalah menguji apakah mungkin untuk menginstal sistem operasi pada komputer . Pilih OS gratis favorit Anda dan mulai instalasi normal. Saya merekomendasikan Ubuntu Server LTS x64 karena memiliki harapan yang jauh lebih rendah tentang perangkat keras video Anda. Unduh ISO dan tulis ke USB flash drive yang dapat di-boot, lalu boot dari sana.

gambar
(Hei, lihat saja, ada opsi untuk menguji memori! Betapa bijaksana!)

  • Pastikan Anda memiliki koneksi internet yang stabil dengan DHCP. Ini akan memungkinkan instalasi berjalan lebih cepat.
  • , Enter , . , , Linux, , — .
  • , , jeff password, .
  • CD, . , .

Jika terjadi sesuatu selama instalasi  yang mencegah penyelesaian dari ...  komputer Anda tidak dapat diandalkan . Saya tahu bahwa ini tidak memberikan banyak informasi tentang masalah, tetapi menginstal OS adalah ujian ekstensif yang baik untuk keseluruhan sistem.

Bagaimanapun, untuk tes-tes berikut ini, kita akan membutuhkan OS yang diinstal. Di masa depan, saya berasumsi bahwa Anda telah menginstal Ubuntu, tetapi dalam kenyataannya setiap distribusi Linux akan dilakukan.

Unit pemrosesan sentral


Sekarang, mari kita pastikan otak komputer kita teratur. Jujur, jika Anda mencapai titik ini, dan tes memori dan OS berhasil, maka kemungkinan Anda memiliki komputer yang salah hampir nol. Tapi kita harus yakin, dan cara terbaik untuk mencapainya adalah beralih ke teman lama kita, Maren Mersenne.

gambar
(. Mersenne numbers) — Mn = 2^n — 1, n — . , . 17 .

Saya biasanya menggunakan Prime95 dan Mprime - program yang menganalisis sejumlah besar jumlah raksasa untuk menentukan apakah mereka sederhana. Berikut ini cara kami mengunduh dan menginstal mprime di Server Ubuntu kami yang baru saja diinstal: (Anda mungkin perlu mengganti nomor versi dalam perintah dengan versi terbaru saat ini dari sini: www.mersenne.org/download , tetapi pada saat penulisan, versi yang saya kutip adalah yang terbaru). Sekarang jalankan mprime dengan perintah ./mprime Jawab N.

mkdir mprime
cd mprime
wget mersenne.org/gimps/p95v287.linux64.tar.gz
tar xzvf p95v287.linux64.tar.gz
rm p95v287.linux64.tar.gz





gambar



Selanjutnya, Anda akan diminta untuk menunjukkan jumlah tes yang akan dilakukan. Tetapi program ini cerdas dan secara default ia memilih jumlah utas yang sama dengan jumlah inti logis, jadi cukup tekan enter - kita perlu pengujian penuh semua prosesor dan inti. Selanjutnya, pilih jenis pengujian:

  1. FFT kecil (panas maksimum + stress test FPU, data ditempatkan di L2 cache, RAM praktis tidak diuji).
  2. FFT besar di tempat (konsumsi listrik maksimum, menguji RAM sedikit).
  3. Blend (hanya sedikit, banyak tes RAM).

Saya akan membuat reservasi bahwa mereka tidak bercanda, mengatakan "konsumsi listrik maksimum." Pilih 2, lalu Y untuk mulai menyiksa prosesor Anda. Sekarang perhatikan dia menggeliat kesakitan. Sekarang adalah waktu yang tepat untuk mengungkap Kill-a-Watt Anda atau meteran energi serupa lainnya. Jika sudah, Anda dapat mengukur konsumsi daya maksimum prosesor. Dalam kebanyakan sistem, CPU adalah satu-satunya konsumen energi yang signifikan dalam sistem, hanya jika Anda tidak memiliki kartu grafis permainan yang kuat. Saya juga merekomendasikan meluncurkan i7z di terminal berbeda: dengan cara ini Anda dapat memonitor suhu dan frekuensi inti, sementara mprime melakukan tugasnya. Biarkan mprime bekerja sepanjang malam dalam panas maksimum

Accept the answers above? (Y):
[Main thread Feb 14 05:48] Starting workers.
[Worker #2 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Setting affinity to run worker on logical CPU #2
[Worker #4 Feb 14 05:48] Worker starting
[Worker #2 Feb 14 05:48] Setting affinity to run worker on logical CPU #3
[Worker #1 Feb 14 05:48] Worker starting
[Worker #1 Feb 14 05:48] Setting affinity to run worker on logical CPU #1
[Worker #4 Feb 14 05:48] Setting affinity to run worker on logical CPU #4
[Worker #2 Feb 14 05:48] Beginning a continuous self-test on your computer.
[Worker #4 Feb 14 05:48] Test 1, 44000 Lucas-Lehmer iterations of M7471105 using FMA3 FFT length 384K, Pass1=256, Pass2=1536.





sudo apt-get install i7z
sudo i7z

. Semua perhitungan diperiksa dengan teliti, jadi jika beberapa jenis kesalahan terjadi di suatu tempat, seluruh proses akan terputus dan menampilkan kesalahan ke konsol. Secara umum, jika mprime terganggu ... komputer Anda tidak dapat diandalkan .

gambar

Perhatikan suhu prosesor ! Selain suhu absolut prosesor, juga perlu untuk memantau total panas yang dihasilkan dalam sistem. Kipas harus meningkatkan kecepatan dan suhu seluruh sistem harus dijaga dalam batas yang dapat diterima, jika tidak pada akhirnya Anda akan mendapatkan komputer yang rusak dan terlalu panas.

Kabar buruknya adalah bahwa dalam praktiknya, komputer hampir tidak pernah mengalami beban seperti itu. Kabar baiknya adalah bahwa jika sistem Anda dapat bertahan malam dalam mode ini - itu 100% siap untuk tugas dan kelebihan apa pun.

Berkendara


Disk mungkin yang paling mudah untuk diganti, tetapi pada saat yang sama mereka adalah kandidat yang paling mungkin untuk gagal. Kami tahu bahwa disk tidak dapat rusak - kami baru saja menginstal OS baru, tetapi tes tambahan tidak akan merugikan.

Mari kita mulai dengan menguji blok "buruk" (Badblocks) : Jadi, kami sepenuhnya menguji seluruh disk (dalam mode baca aman). Saya pikir, tanpa penjelasan, jelas bahwa setiap kesalahan harus membuat Anda meragukan kesehatan disk Anda. Sekarang periksa catatan SMART untuk drive kami. Perintah di atas akan memberi tahu Anda jika drive Anda mendukung SMART. Jika demikian, mari kita aktifkan: Sekarang kita siap untuk menjalankan tes SMART. Tapi pertama-tama, mari kita cari tahu berapa lama tes yang berbeda akan berjalan: Jalankan

sudo badblocks -sv /dev/sda



Checking blocks 0 to 125034839
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found. (0/0/0 errors)



sudo apt-get install smartmontools
smartctl -i /dev/sda



smartctl -s on /dev/sda



smartctl -c /dev/sda

tes panjang jika Anda punya waktu atau pendek jika tidak. Tes dilakukan secara tidak sinkron; setelah waktu yang ditentukan berlalu, buka laporan uji SMART dan pastikan semuanya berhasil: Selanjutnya, jalankan patokan sederhana untuk memastikan bahwa kinerja disk kira-kira seperti yang diharapkan: Untuk sistem dengan SSD normal, Anda harus mendapatkan setidaknya hasil berikut, tetapi lebih baik semuanya jauh lebih baik: Akhirnya, kami akan melakukan tes yang lebih intensif menggunakan Bonnie ++ : Hasil numerik yang diperoleh tidak terlalu penting bagi kami, penting bagi kami bahwa tes berakhir tanpa kesalahan. Jika Anda mendapatkan kesalahan selama langkah-langkah di atas ... komputer Anda tidak dapat diandalkan .

smartctl -t long /dev/sda



=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 100 -



dd bs=1M count=512 if=/dev/zero of=test conv=fdatasync
hdparm -Tt /dev/sda



536870912 bytes (537 MB) copied, 1.52775 s, 351 MB/s
Timing cached reads: 11434 MB in 2.00 seconds = 5720.61 MB/sec
Timing buffered disk reads: 760 MB in 3.00 seconds = 253.09 MB/sec



sudo apt-get install bonnie++
bonnie++ -f



(Saya percaya bahwa tes yang saya berikan sangat bagus untuk penggunaan sehari-hari, khususnya untuk disk di RAID. Namun, jika Anda ingin menguji disk Anda lebih teliti, saya sarankan sumber yang bagus: FreeNAS "cara membakar di hard drive" )

Jaringan


Jujur, saya tidak punya banyak pengalaman dengan masalah jaringan. Tapi saya percaya pada pentingnya bandwidth, dan ini adalah hal yang dapat diverifikasi.

Anda akan membutuhkan dua komputer untuk tes iperf . Katakanlah server kami memiliki alamat 10.0.0.1, berikut adalah perintah untuknya: Dan inilah klien kami, yang akan terhubung ke server dan memantau seberapa cepat kami dapat mentransfer data antar mesin: Anda akan melihat sekitar 120 megabita / detik (960 megabita) / detik) untuk koneksi Ethernet gigabit tunggal. Jika Anda beruntung memiliki koneksi 10 gigabit, bagus, selamat atas 1,2 gigabita / detik Anda.

sudo apt-get install iperf
iperf -s



sudo apt-get install iperf
iperf -c 10.0.0.1

------------------------------------------------------------
Client connecting to 10.0.0.1, TCP port 5001
TCP window size: 23.5 KByte (default)
------------------------------------------------------------
[ 3] local 10.0.0.2 port 43220 connected with 10.0.0.1 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0-10.0 sec 1.09 GBytes 933 Mbits/sec



Kartu video


Saya tidak membahas masalah ini, karena sebagian kecil dari komputer yang saya bangun membutuhkan sesuatu yang lebih dari GPU terintegrasi dalam prosesor. Omong-omong, GPU terintegrasi secara mengejutkan sangat baik .

Tapi kamu seorang gamer, kan? Maka Anda perlu mem-boot ke Windows dan mencoba sesuatu seperti furmark . Dan Anda harus menguji kartu video, karena kartu video, terutama kartu game, sering kali merupakan perangkat paling kuat dan kompleks yang menghabiskan banyak watt. Dan ya, perhatikan suhunya.

Yah, mungkin komputer Anda bisa diandalkan


Saya menerapkan semua yang dijelaskan di atas untuk semua komputer yang saya kumpulkan, dan semua ini dengan sempurna memenuhi tugasnya. Jadi, saya menemukan prosesor, RAM, disk, sistem pendingin yang rusak sebelum menyebabkan masalah dalam pekerjaan utama. Semua ini tidak berarti bahwa komputer tidak akan pernah rusak, tetapi saya melakukan semua yang saya bisa untuk memastikan bahwa komputer saya akan bertahan lama.

Siapa tahu, mungkin keberuntungan akan menemani Anda dan Anda akan dikenal sebagai seorang pria yang servernya memiliki uptime 16 tahun sampai dihapuskan.

gambar

Semua tes ini hanyalah titik awal. Beri tahu kami teknik mana yang Anda gunakan untuk memastikan komputer Anda stabil dan andal. Bagaimana Anda meningkatkan tes yang saya usulkan sesuai dengan pengalaman Anda?

Source: https://habr.com/ru/post/id390499/


All Articles