Votre ordinateur est-il fiable?

Je vous présente la traduction d'un article de Jeff Atwood sur le test de nouveaux ordinateurs. Je n'ai pas vu un seul article de cette qualité sur ce sujet; l'article fournit toutes les informations nécessaires et rien de plus, ainsi qu'un matériel bien structuré. J'espère que vous l'aimez aussi.

Jeff est le fondateur de StackOverflow . Il travaille actuellement sur le projet Discourse .

Article d'origine: votre ordinateur est-il stable?

Avertissement: Bien que l'article soit intitulé " Votre ordinateur est-il fiable ?", Il ne s'agit pas de fiabilité en tant que terme (fiabilité en anglais), mais plutôt de stabilité (stabilité en anglais). Un article sur la façon dont l'auteur teste la stabilité et la durabilité de nouveaux ordinateurs.


Si ma mémoire est bonne, j'ai assemblé une centaine d'ordinateurs au cours des vingt dernières années. Ce n'est pas si difficile et, en fait, cela devient plus facile avec le temps, à mesure que les ordinateurs deviennent de plus en plus compatibles.

Par exemple, voici ce dont vous pourriez avoir besoin pour construire Scooter Computer :

  1. Appliquez un peu de pâte thermique sur le dessus du boîtier.
  2. Placez la carte mère dans le boîtier.
  3. Vissez la carte mère au boîtier.
  4. Insérez une carte SSD.
  5. Insérez la carte RAM.
  6. Connectez l'alimentation externe.
  7. Démarrez.

C’est tout.



C'est ridiculement simple. Mon fils de six ans et moi avons assemblé des constructeurs Lego, ce qui était beaucoup plus compliqué. L'assemblage des PC traditionnels diffère en quelques étapes supplémentaires: insérer un processeur, un dissipateur thermique, connecter des câbles. Et enfin, la construction du serveur ajoute quelques actions mineures supplémentaires, éventuellement avec des restrictions sur la taille de l'assemblage. Un mini-ordinateur, un PC ordinaire ou un serveur - si vous avez pu en assembler un - considérez que vous les avez tous récupérés.

Chacun de nous exhale avec soulagement lorsque l'ordinateur qui vient d'être assemblé est démarré pour la première fois, et quel que soit le nombre de machines assemblées dans votre compte. Mais le chargement n'est qu'un début. C'est génial si ça démarre, mais vous ne surprendrez personne. En fait, nous devons savoir si cet ordinateur est fiable .

Et bien que les composants informatiques deviennent de plus en plus fiables chaque année et que les fabricants effectuent de nombreux tests avant l'expédition, rien ne garantit que toutes les pièces fonctionneront de manière fiable ensemble, dans votre environnement particulier. Et il y a toujours une chance que vous rencontriez des pièces de rechange avec des défauts internes insaisissables - même si cette probabilité est très faible.

Puisque nous sommes des scientifiques, nous testons les choses dans les bonnes conditions et collectons des données pour prouver que notre ordinateur fonctionne de manière stable . Par conséquent, après le chargement, nous commençons les tests.

La mémoire


J'aime commencer par les tests de mémoire, car il n'a pas besoin d'avoir un système d'exploitation installé et cela fonctionne de la même manière sur tous les ordinateurs x86. Memtest86 est "l'arrière-grand-père" de tous les testeurs de mémoire. Je ne sais pas pourquoi lui et Memtest86 + se séparent, mais ils fonctionnent presque de la même manière. PassMark est une version plus récente, c'est pourquoi je la recommande .

Téléchargez la version qui vous convient, écrivez-la sur une clé USB bootable, insérez-la dans un nouvel ordinateur, démarrez et laissez le programme faire son travail. Tout fonctionne en mode automatique - il suffit de démarrer et de voir comment le test s'exécute.

image
(si votre ordinateur prend en charge le démarrage UEFI, une version plus récente 6.x sera à votre disposition, dans un autre cas - la version 4.2, qui est montrée dans la capture d'écran).

Je recommande au moins une passe memtest complète , et si vous devez avoir confiance en la stabilité de votre ordinateur, laissez-le être testé pendant la nuit. Si vous avez beaucoup de mémoire, soyez patient. Pour nos serveurs avec 128 Go de mémoire, les tests ont pris environ 3 heures.

La valeur «Pass» en haut de l'écran doit atteindre 100% et la valeur «Pass» dans le tableau doit être supérieure à un. Si vous obtenez des erreurs, et même tout sauf une note nette de 100% - votre ordinateur n'est pas fiable . Dans ce cas, il convient de commencer à retirer les cartes mémoire afin de détecter une carte défectueuse.

Système d'exploitation


Tous les tests ultérieurs nécessiteront un système d'exploitation installé, et le plus important de tous les tests de fiabilité consiste à tester s'il est possible d'installer un système d'exploitation sur un ordinateur . Choisissez votre système d'exploitation gratuit préféré et lancez l'installation normale. Je recommande Ubuntu Server LTS x64 , car il attend beaucoup moins de votre équipement vidéo. Téléchargez l'ISO et écrivez-la sur une clé USB amorçable, puis démarrez-la.

image
(Hé, regardez, il y a une option pour tester la mémoire! Quelle prudence!)

  • Assurez-vous que vous disposez d'une connexion Internet stable avec DHCP. Cela permettra à l'installation d'aller plus vite.
  • , Enter , . , , Linux, , — .
  • , , jeff password, .
  • CD, . , .

Si quelque chose se produit pendant l'installation  qui empêche l'installation de se terminer ...  votre ordinateur n'est pas fiable . Je sais que cela ne fournit pas beaucoup d'informations sur le problème, mais l'installation du système d'exploitation est un bon test complet de l'ensemble du système.

Dans tous les cas, pour les tests suivants, nous aurons besoin d'un OS installé. À l'avenir, je suppose que vous avez installé Ubuntu, mais en réalité, n'importe quelle distribution Linux fera l'affaire.

Unité centrale de traitement


Maintenant, assurons-nous que le cerveau de notre ordinateur est en ordre. Honnêtement, si vous avez atteint ce point et que les tests de mémoire et de système d'exploitation ont réussi, la probabilité que vous ayez un ordinateur défectueux est presque nulle. Mais nous devons être sûrs, et la meilleure façon d'y parvenir est de nous tourner vers notre ancienne amie, Maren Mersenne.

image
(. Mersenne numbers) — Mn = 2^n — 1, n — . , . 17 .

J'utilise habituellement Prime95 et Mprime - des programmes qui analysent un grand nombre de nombres géants afin de déterminer s'ils sont simples. Voici comment télécharger et installer mprime sur notre serveur Ubuntu fraîchement installé: (Vous devrez peut-être remplacer le numéro de version dans les commandes par la dernière version actuelle à partir d'ici: www.mersenne.org/download , mais au moment de la rédaction, la version que j'ai citée est la plus récente). Exécutez maintenant mprime avec la commande ./mprime Answer N.

mkdir mprime
cd mprime
wget mersenne.org/gimps/p95v287.linux64.tar.gz
tar xzvf p95v287.linux64.tar.gz
rm p95v287.linux64.tar.gz





image



Ensuite, il vous sera demandé d'indiquer le nombre de tests à effectuer. Mais le programme est intelligent et par défaut, il sélectionne le nombre de threads égal au nombre de cœurs logiques, alors appuyez simplement sur Entrée - nous avons besoin de tests complets de tous les processeurs et cœurs. Ensuite, sélectionnez le type de test:

  1. Petites FFT (FPU de test de chaleur et de stress maximum, les données sont placées dans le cache L2, la RAM n'est pratiquement pas testée).
  2. Grandes FFT sur place (consommation électrique maximale, teste un peu la RAM).
  3. Mélange (juste un peu, beaucoup de tests RAM).

Je ferai une réservation pour qu'ils ne plaisantent pas en disant "consommation maximale d'électricité". Choisissez 2, puis Y pour commencer à torturer votre processeur. Maintenant, regardez-le se tordre de douleur. C'est le bon moment pour découvrir votre Kill-a-Watt ou tout autre compteur d'énergie similaire. Si vous en avez un, vous pouvez mesurer la consommation électrique maximale du processeur. Dans la plupart des systèmes, le processeur est le seul consommateur d'énergie important du système, uniquement si vous ne disposez pas d'une carte graphique de jeu puissante. Je recommande également de lancer i7z dans un autre terminal: de cette façon, vous pouvez surveiller la température et les fréquences centrales, tandis que mprime fait son travail. Laissez mprime fonctionner toute la nuit dans un maximum de chaleur

Accept the answers above? (Y):
[Main thread Feb 14 05:48] Starting workers.
[Worker #2 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Worker starting
[Worker #3 Feb 14 05:48] Setting affinity to run worker on logical CPU #2
[Worker #4 Feb 14 05:48] Worker starting
[Worker #2 Feb 14 05:48] Setting affinity to run worker on logical CPU #3
[Worker #1 Feb 14 05:48] Worker starting
[Worker #1 Feb 14 05:48] Setting affinity to run worker on logical CPU #1
[Worker #4 Feb 14 05:48] Setting affinity to run worker on logical CPU #4
[Worker #2 Feb 14 05:48] Beginning a continuous self-test on your computer.
[Worker #4 Feb 14 05:48] Test 1, 44000 Lucas-Lehmer iterations of M7471105 using FMA3 FFT length 384K, Pass1=256, Pass2=1536.





sudo apt-get install i7z
sudo i7z

. Tous les calculs sont soigneusement vérifiés, donc si une sorte d'erreur se produit quelque part, tout le processus sera interrompu et générera l'erreur sur la console. En général, si mprime est interrompu ... votre ordinateur n'est pas fiable .

image

Surveillez la température du processeur ! En plus de la température absolue du processeur, il est également nécessaire de surveiller la chaleur totale dans le système. Les ventilateurs doivent augmenter la vitesse et la température de l'ensemble du système doit être maintenue dans des limites acceptables, sinon vous obtiendrez un ordinateur surchauffé défectueux.

La mauvaise nouvelle est qu'en pratique, les ordinateurs ne subissent presque jamais de telles charges. La bonne nouvelle est que si votre système peut résister à la nuit dans ce mode, il est prêt à 100% pour toutes les tâches et surcharges.

Conduire


Les disques sont probablement les plus faciles à remplacer, mais en même temps, ils sont les candidats les plus probables à l'échec. Nous savons que le disque ne peut pas être cassé - nous venons d'installer un nouveau système d'exploitation, mais un test supplémentaire ne fera pas de mal.

Commençons par tester les «mauvais» blocs (Badblocks) : Nous testons donc entièrement le disque entier (en mode lecture sécurisée). Je pense que, sans explication, il est clair que toute erreur devrait vous faire douter de la santé de votre disque. Maintenant, vérifiez les enregistrements SMART de notre lecteur. La commande ci-dessus vous indiquera si votre lecteur prend en charge SMART. Si oui, activons-le: nous sommes maintenant prêts à exécuter des tests SMART. Mais d'abord, découvrons combien de temps les différents tests dureront: Exécuter

sudo badblocks -sv /dev/sda



Checking blocks 0 to 125034839
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found. (0/0/0 errors)



sudo apt-get install smartmontools
smartctl -i /dev/sda



smartctl -s on /dev/sda



smartctl -c /dev/sda

test long si vous avez le temps ou court sinon. Les tests sont effectués de manière asynchrone; une fois le délai spécifié écoulé, ouvrez le rapport de test SMART et assurez-vous que tout est réussi: Ensuite, exécutez un test de performance simple pour vous assurer que les performances du disque sont approximativement conformes aux attentes: Pour un système avec un SSD normal, vous devriez obtenir au moins les résultats suivants, mais plutôt de tout est beaucoup mieux: Enfin, nous allons effectuer un test plus intensif en utilisant bonnie ++ : Les résultats numériques obtenus ne sont pas très importants pour nous, il est important pour nous que le test se termine sans erreur. Si vous obtenez des erreurs au cours des étapes ci-dessus ... votre ordinateur n'est pas fiable .

smartctl -t long /dev/sda



=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 100 -



dd bs=1M count=512 if=/dev/zero of=test conv=fdatasync
hdparm -Tt /dev/sda



536870912 bytes (537 MB) copied, 1.52775 s, 351 MB/s
Timing cached reads: 11434 MB in 2.00 seconds = 5720.61 MB/sec
Timing buffered disk reads: 760 MB in 3.00 seconds = 253.09 MB/sec



sudo apt-get install bonnie++
bonnie++ -f



(Je crois que les tests que j'ai donnés sont parfaits pour une utilisation quotidienne, en particulier pour les disques en RAID. Cependant, si vous voulez tester vos disques encore plus en profondeur, je suggère une bonne ressource: FreeNAS "comment graver sur des disques durs" )

Réseau


Honnêtement, je n'ai pas beaucoup d'expérience avec les problèmes de réseau. Mais je crois en l'importance de la bande passante, et c'est exactement la chose qui peut être vérifiée.

Vous aurez besoin de deux ordinateurs pour le test iperf . Supposons que notre serveur ait une adresse de 10.0.0.1, voici les commandes: Et voici notre client, qui se connectera au serveur et surveillera la vitesse à laquelle nous pouvons transférer des données entre machines: vous devriez voir environ 120 mégaoctets / sec (960 mégaoctets) / sec) pour une seule connexion Ethernet gigabit. Si vous avez la chance d'avoir une connexion de 10 gigabits, super, félicitations pour vos 1,2 gigaoctets / sec.

sudo apt-get install iperf
iperf -s



sudo apt-get install iperf
iperf -c 10.0.0.1

------------------------------------------------------------
Client connecting to 10.0.0.1, TCP port 5001
TCP window size: 23.5 KByte (default)
------------------------------------------------------------
[ 3] local 10.0.0.2 port 43220 connected with 10.0.0.1 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0-10.0 sec 1.09 GBytes 933 Mbits/sec



Carte vidéo


Je ne couvre pas ce problème, car une très petite partie des ordinateurs que je construis a besoin de quelque chose de plus que le GPU intégré dans le processeur. Soit dit en passant, les GPU intégrés sont étonnamment très bons .

Mais vous êtes un joueur, non? Ensuite, vous devez démarrer sous Windows et essayer quelque chose comme furmark . Et vous devez tester la carte vidéo, car les cartes vidéo, en particulier celles de jeu, sont souvent l'appareil le plus puissant et le plus complexe qui consomme une énorme quantité de watts. Et oui, surveillez la température.

Eh bien, votre ordinateur est peut - être fiable


J'applique tout ce qui est décrit ci-dessus à tous les ordinateurs que je collectionne, et tout cela remplit parfaitement sa tâche. Ainsi, je trouve des processeurs, RAM, disques, systèmes de refroidissement défectueux avant qu'ils ne causent des problèmes dans le travail principal. Tout cela ne signifie pas que l'ordinateur ne tombera jamais en panne, mais j'ai fait tout ce que je pouvais pour être sûr que mes ordinateurs dureraient longtemps.

Qui sait, peut-être que la chance vous accompagnera et que vous deviendrez connu comme un gars dont le serveur avait 16 ans de disponibilité jusqu'à ce qu'il soit annulé.

image

Tous ces tests ne sont qu'un point de départ. Dites-nous quelles techniques vous utilisez pour vous assurer que vos ordinateurs sont stables et fiables? Comment amélioreriez-vous mes tests en fonction de votre expérience?

Source: https://habr.com/ru/post/fr390499/


All Articles