Ist Ihr Computer zuverlässig?
Ich präsentiere Ihnen die Übersetzung eines Artikels von Jeff Atwood über das Testen neuer Computer. Ich habe zu diesem Thema keinen einzigen Artikel dieser Qualität gesehen. Der Artikel enthält alle notwendigen Informationen und nichts weiter sowie gut strukturiertes Material. Ich hoffe es gefällt euch auch.
Jeff ist der Gründer von StackOverflow . Derzeit arbeitet er am Discourse- Projekt .
Originalartikel: Ist Ihr Computer stabil?
Haftungsausschluss: Obwohl der Artikel den Titel " Ist Ihr Computer zuverlässig ?" Trägt , geht es nicht um Zuverlässigkeit als Begriff (englische Zuverlässigkeit), sondern um Stabilität (englische Stabilität). Ein Artikel darüber, wie der Autor neue Computer auf Stabilität und Haltbarkeit testet.
Wenn mein Gedächtnis mir recht tut, habe ich in den letzten zwanzig Jahren ungefähr hundert Computer zusammengebaut. Dies ist nicht so schwierig und wird mit der Zeit immer einfacher, da Computer immer kompatibler werden.Zum Beispiel benötigen Sie Folgendes, um einen Scooter-Computer zu erstellen :- Tragen Sie etwas Wärmeleitpaste auf die Oberseite des Gehäuses auf.
- Legen Sie das Motherboard in das Gehäuse.
- Schrauben Sie das Motherboard an das Gehäuse.
- Legen Sie eine SSD-Karte ein.
- RAM-Karte einlegen.
- Schließen Sie die externe Stromversorgung an.
- Starten Sie.
Das ist alles.Es ist lächerlich einfach. Mein sechsjähriger Sohn und ich haben Lego-Konstrukteure zusammengebaut, die viel komplizierter waren. Die Montage herkömmlicher PCs unterscheidet sich in nur wenigen zusätzlichen Schritten: Einsetzen eines Prozessors, Kühlkörpers, Anschließen von Kabeln. Und schließlich werden durch das Erstellen des Servers einige kleinere Aktionen hinzugefügt, möglicherweise mit Einschränkungen hinsichtlich der Größe der Assembly. Ein Mini-Computer, ein gewöhnlicher PC oder ein Server - wenn Sie einen davon zusammenbauen konnten - denken Sie, Sie haben alle gesammelt.Jeder von uns atmet erleichtert aus, wenn der gerade zusammengebaute Computer zum ersten Mal hochfährt, und es spielt keine Rolle, wie viele Maschinen in Ihrem Konto zusammengebaut sind. Das Laden ist jedoch nur der Anfang. Das ist großartig, wenn es hochfährt, aber Sie werden niemanden überraschen. In der Tat müssen wir wissen, ob dieser Computer zuverlässig ist .Und obwohl Computerkomponenten von Jahr zu Jahr zuverlässiger werden und die Hersteller vor dem Versand zahlreiche Tests durchführen, gibt es keine Garantie dafür, dass alle Teile in Ihrer speziellen Umgebung zuverlässig zusammenarbeiten. Und es besteht immer die Möglichkeit, dass Sie auf Teile mit schwer fassbaren internen Fehlern stoßen - auch wenn diese Wahrscheinlichkeit sehr gering ist.Da wir Wissenschaftler sind, testen wir Dinge unter den richtigen Bedingungen und sammeln Daten, um zu beweisen, dass unser Computer stabil funktioniert . Daher starten wir nach dem Laden die Tests.Speicher
Ich beginne gerne mit Speichertests, da kein Betriebssystem installiert sein muss und auf allen x86-Computern gleich funktioniert. Memtest86 ist der "Urgroßvater" aller Gedächtnistester. Ich bin mir nicht sicher, warum er und Memtest86 + sich getrennt haben, aber sie funktionieren fast genauso. PassMark ist eine neuere Version, weshalb ich es empfehle .Laden Sie die für Sie geeignete Version herunter, schreiben Sie sie auf ein bootfähiges USB-Flash-Laufwerk, stecken Sie sie in einen neuen Computer, starten Sie das Programm und lassen Sie das Programm seine Arbeit erledigen. Alles funktioniert im automatischen Modus - starten Sie einfach und sehen Sie, wie der Test ausgeführt wird.
(Wenn Ihr Computer den UEFI-Start unterstützt, steht Ihnen eine neuere Version 6.x zur Verfügungin einem anderen Fall - Version 4.2, die im Screenshot gezeigt wird).Ich empfehle mindestens einen vollständigen Memtest-Pass . Wenn Sie sich auf die Stabilität Ihres Computers verlassen müssen, lassen Sie ihn über Nacht testen. Wenn Sie viel Gedächtnis haben, haben Sie etwas Geduld. Bei unseren Servern mit 128 GB Speicher dauerte der Test ca. 3 Stunden.Der Wert „Bestanden“ am oberen Bildschirmrand sollte 100% erreichen, und der Wert „Bestanden“ in der Tabelle sollte mehr als eins betragen. Wenn Sie Fehler erhalten und in der Tat alles andere als eine saubere Note von 100% - ist Ihr Computer nicht zuverlässig . In diesem Fall lohnt es sich, die Speicherkarten zu entfernen, um eine fehlerhafte zu erkennen.Operationssystem
Für alle nachfolgenden Tests ist ein installiertes Betriebssystem erforderlich. Der wichtigste aller Zuverlässigkeitstests besteht darin, zu testen, ob ein Betriebssystem auf einem Computer installiert werden kann . Wählen Sie Ihr kostenloses Lieblingsbetriebssystem und starten Sie die normale Installation. Ich empfehle Ubuntu Server LTS x64, da es viel geringere Erwartungen an Ihre Videohardware hat. Laden Sie die ISO herunter, schreiben Sie sie auf ein bootfähiges USB-Flash-Laufwerk und booten Sie dann von dort.
(Hey, schau mal, es gibt eine Option zum Testen des Gedächtnisses! Wie umsichtig!)- Stellen Sie sicher, dass Sie eine stabile Internetverbindung mit DHCP haben. Dadurch kann die Installation schneller durchgeführt werden.
- , Enter , . , , Linux, , — .
- , , jeff password, .
- CD, . , .
Wenn während der Installation etwas passiert , das den Abschluss der Installation verhindert, ist Ihr Computer nicht zuverlässig . Ich weiß, dass dies nicht viele Informationen über das Problem liefert, aber die Installation des Betriebssystems ist ein guter, umfassender Test des gesamten Systems.In jedem Fall benötigen wir für die folgenden Tests ein installiertes Betriebssystem. In Zukunft gehe ich davon aus, dass Sie Ubuntu installiert haben, aber in Wirklichkeit reicht jede Linux-Distribution aus.Zentraleinheit
Stellen wir jetzt sicher, dass die Gehirne unseres Computers in Ordnung sind. Wenn Sie diesen Punkt erreicht haben und die Speicher- und Betriebssystemtests erfolgreich waren, ist die Wahrscheinlichkeit, dass Sie einen fehlerhaften Computer haben, nahezu Null. Aber wir müssen sicher sein, und der beste Weg, dies zu erreichen, besteht darin, sich an unsere alte Freundin Maren Mersenne zu wenden.
(. Mersenne numbers) — Mn = 2^n — 1, n — . , . 17 .
Normalerweise verwende ich Prime95- und Mprime- Programme, die eine große Anzahl von Riesenzahlen analysieren, um festzustellen, ob sie einfach sind. So laden wir mprime herunter und installieren es auf unserem frisch installierten Ubuntu-Server: (Möglicherweise müssen Sie die Versionsnummer in den Befehlen durch die aktuellste Version von hier ersetzen : www.mersenne.org/download , aber zum Zeitpunkt des Schreibens ist die von mir angegebene Version die neueste). Führen Sie nun mprime mit dem Befehl ./mprime Answer N aus.mkdir mprime
cd mprime
wget mersenne.org/gimps/p95v287.linux64.tar.gz
tar xzvf p95v287.linux64.tar.gz
rm p95v287.linux64.tar.gz
Als Nächstes werden Sie aufgefordert, die Anzahl der durchzuführenden Tests anzugeben. Das Programm ist jedoch intelligent und wählt standardmäßig die Anzahl der Threads aus, die der Anzahl der logischen Kerne entspricht. Drücken Sie einfach die Eingabetaste. Wir müssen alle Prozessoren und Kerne vollständig testen. Wählen Sie als Nächstes die Art des Tests aus:- Kleine FFTs (FPU für maximale Hitze + Stresstest, Daten werden in den L2-Cache gestellt, RAM wird praktisch nicht getestet).
- In-Place große FFTs (maximaler Stromverbrauch, testet RAM ein wenig).
- Blend (nur ein bisschen, viele RAM-Tests).
Ich werde reservieren, dass sie nicht scherzen und "maximaler Stromverbrauch" sagen. Wählen Sie 2 und dann Y, um Ihren Prozessor zu quälen. Jetzt sieh zu, wie er sich vor Schmerzen windet. Jetzt ist der richtige Zeitpunkt, um Ihren Kill-a-Watt oder einen ähnlichen Energiezähler aufzudecken. Wenn Sie einen haben, können Sie den maximalen Stromverbrauch des Prozessors messen . In den meisten Systemen ist die CPU der einzige bedeutende Energieverbraucher im System, nur wenn Sie keine leistungsstarke Gaming-Grafikkarte haben. Ich empfehle außerdem, i7z in einem anderen Terminal zu starten: Auf diese Weise können Sie die Kerntemperatur und -frequenzen überwachen, während mprime seine Aufgabe erledigt. Lassen Sie mprime die ganze Nacht bei maximaler Hitze laufenAccept the answers above? (Y):
[Main thread Feb 14 05:48] Starting workers.
[Worker #2 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Setting affinity to run worker on logical CPU #2
[Worker #4 Feb 14 05:48] Worker starting
[Worker #2 Feb 14 05:48] Setting affinity to run worker on logical CPU #3
[Worker #1 Feb 14 05:48] Worker starting
[Worker #1 Feb 14 05:48] Setting affinity to run worker on logical CPU #1
[Worker #4 Feb 14 05:48] Setting affinity to run worker on logical CPU #4
[Worker #2 Feb 14 05:48] Beginning a continuous self-test on your computer.
[Worker #4 Feb 14 05:48] Test 1, 44000 Lucas-Lehmer iterations of M7471105 using FMA3 FFT length 384K, Pass1=256, Pass2=1536.
sudo apt-get install i7z
sudo i7z
. Alle Berechnungen werden sorgfältig geprüft. Wenn also irgendwo ein Fehler auftritt, wird der gesamte Prozess unterbrochen und der Fehler an die Konsole ausgegeben. Wenn mprime unterbrochen wird, ist Ihr Computer im Allgemeinen nicht zuverlässig .
Beobachten Sie die Temperatur des Prozessors ! Neben der absoluten Temperatur des Prozessors muss auch die Gesamtwärme im System überwacht werden. Lüfter sollten die Drehzahl erhöhen und die Temperatur des gesamten Systems sollte innerhalb akzeptabler Grenzen gehalten werden, da sonst ein fehlerhafter, überhitzter Computer entsteht.Die schlechte Nachricht ist, dass Computer in der Praxis fast nie solchen Belastungen ausgesetzt sind. Die gute Nachricht ist, dass Ihr System, wenn es in diesem Modus der Nacht standhält, zu 100% für alle Aufgaben und Überlastungen bereit ist.Fahren
Festplatten sind wahrscheinlich am einfachsten zu ersetzen, aber gleichzeitig sind sie die wahrscheinlichsten Kandidaten für einen Ausfall. Wir wissen, dass die Festplatte nicht beschädigt werden kann - wir haben gerade ein neues Betriebssystem installiert, aber ein zusätzlicher Test wird nicht schaden.Beginnen wir mit dem Testen der "fehlerhaften" Blöcke (Badblocks) : Wir testen also die gesamte Festplatte vollständig (im sicheren Lesemodus). Ich denke, ohne Erklärung ist es klar, dass Fehler Sie an der Gesundheit Ihrer Festplatte zweifeln lassen sollten. Überprüfen Sie nun die SMART-Datensätze für unser Laufwerk. Mit dem obigen Befehl erfahren Sie, ob Ihr Laufwerk SMART unterstützt. Wenn ja, aktivieren wir es: Jetzt können wir SMART-Tests ausführen. Aber zuerst wollen wir herausfinden, wie lange die verschiedenen Tests ausgeführt werden: Ausführensudo badblocks -sv /dev/sda
Checking blocks 0 to 125034839
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found. (0/0/0 errors)
sudo apt-get install smartmontools
smartctl -i /dev/sda
smartctl -s on /dev/sda
smartctl -c /dev/sda
langer Test, wenn Sie Zeit haben oder kurzer, wenn nicht. Tests werden asynchron durchgeführt; Öffnen Sie nach Ablauf der angegebenen Zeit den SMART-Testbericht und stellen Sie sicher, dass alles erfolgreich ist: Führen Sie als Nächstes einen einfachen Benchmark aus, um sicherzustellen, dass die Festplattenleistung ungefähr den Erwartungen entspricht: Bei einem System mit einer normalen SSD sollten Sie mindestens die folgenden Ergebnisse erhalten, jedoch von allem ist viel besser: Schließlich werden wir einen intensiveren Test mit bonnie ++ durchführen : Die erhaltenen numerischen Ergebnisse sind für uns nicht sehr wichtig, es ist für uns wichtig, dass der Test fehlerfrei endet. Wenn Sie während der obigen Schritte Fehler erhalten ... ist Ihr Computer nicht zuverlässig .smartctl -t long /dev/sda
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 100 -
dd bs=1M count=512 if=/dev/zero of=test conv=fdatasync
hdparm -Tt /dev/sda
536870912 bytes (537 MB) copied, 1.52775 s, 351 MB/s
Timing cached reads: 11434 MB in 2.00 seconds = 5720.61 MB/sec
Timing buffered disk reads: 760 MB in 3.00 seconds = 253.09 MB/sec
sudo apt-get install bonnie++
bonnie++ -f
(Ich glaube, dass die Tests, die ich gegeben habe, für den täglichen Gebrauch großartig sind, insbesondere für Festplatten in RAID. Wenn Sie Ihre Festplatten jedoch noch gründlicher testen möchten, empfehle ich eine gute Ressource: FreeNAS "wie man auf Festplatten brennt" )Netzwerk
Ehrlich gesagt habe ich nicht viel Erfahrung mit Netzwerkproblemen. Aber ich glaube an die Bedeutung der Bandbreite, und genau das kann überprüft werden.Für den iperf- Test benötigen Sie zwei Computer . Angenommen, unser Server hat die Adresse 10.0.0.1. Hier sind die Befehle dafür: Und hier ist unser Client, der eine Verbindung zum Server herstellt und überwacht, wie schnell wir Daten zwischen Computern übertragen können: Sie sollten ungefähr 120 Megabyte / s (960 Megabyte) sehen. / sec) für eine einzelne Gigabit-Ethernet-Verbindung. Wenn Sie das Glück haben, eine 10-Gigabit-Verbindung zu haben, herzlichen Glückwunsch zu Ihren 1,2 Gigabyte / s.sudo apt-get install iperf
iperf -s
sudo apt-get install iperf
iperf -c 10.0.0.1
------------------------------------------------------------
Client connecting to 10.0.0.1, TCP port 5001
TCP window size: 23.5 KByte (default)
------------------------------------------------------------
[ 3] local 10.0.0.2 port 43220 connected with 10.0.0.1 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0-10.0 sec 1.09 GBytes 933 Mbits/sec
Grafikkarte
Ich gehe nicht auf dieses Problem ein, da ein sehr kleiner Teil der Computer, die ich baue, etwas mehr als den eingebauten GPU-Prozessor benötigt. Die integrierten GPUs sind übrigens überraschend gut .Aber du bist ein Spieler, oder? Dann müssen Sie Windows starten und so etwas wie Furmark ausprobieren . Und Sie müssen die Grafikkarte testen, da Grafikkarten, insbesondere Spielekarten, häufig das leistungsstärkste und komplexeste Gerät sind, das eine große Menge an Watt verbraucht. Und ja, achten Sie auf die Temperatur.Nun, vielleicht ist Ihr Computer zuverlässig
Ich wende alles oben Beschriebene auf alle Computer an, die ich sammle, und all dies erfüllt seine Aufgabe perfekt. Daher finde ich fehlerhafte Prozessoren, RAM, Festplatten und Kühlsysteme, bevor sie Probleme bei der Hauptarbeit verursachen. All dies bedeutet nicht, dass der Computer niemals ausfallen wird, aber ich habe alles getan, um sicherzugehen, dass meine Computer lange leben.Wer weiß, vielleicht begleitet Sie das Glück und Sie werden als ein Typ bekannt, dessen Server 16 Jahre Betriebszeit hatte, bis er abgeschrieben wurde.
Alle diese Tests sind nur ein Ausgangspunkt. Sagen Sie uns, mit welchen Techniken Sie sicherstellen, dass Ihre Computer stabil und zuverlässig sind. Wie würden Sie meine Tests nach Ihren Erfahrungen verbessern? Source: https://habr.com/ru/post/de390499/
All Articles