
Que se passe-t-il lorsque notre client commande un serveur de configuration arbitraire? Quelle est la fiabilité des serveurs sur mesure? Nous discuterons de ces questions et d'autres en détail dans un nouvel article aujourd'hui.
Ordre du serveur
Malgré le fait que dans la section des serveurs disponibles pour la commande, il existe plusieurs dizaines de configurations différentes, certains clients nécessitent des serveurs avec des configurations spéciales. Le plus souvent, cela est nécessaire pour créer un serveur à très hautes performances ou avec un grand nombre d'unités de disque.
Pour répondre à ce besoin, le service "
Serveur dédié de configuration arbitraire " a été fourni. Le configurateur sur le site vous permet de créer un serveur de toute complexité et de le louer vous-même en quelques minutes. Cependant, peu de gens se demandent comment ces serveurs sont assemblés.
Une fois que le client a décidé de la configuration souhaitée, passé une commande et payé, le système crée automatiquement un ticket dans le panneau de commande. Un tel ticket est envoyé au service d'assemblage et les spécialistes commencent à vérifier la commande et, en fait, l'assemblage du serveur lui-même.
Processus d'assemblage
Chèque de commande
Le configurateur sur le site sélectionne le plus souvent la version «correcte» des composants, mais dans certains cas, les clients peuvent ne pas choisir l'option la plus optimale pour combiner les composants matériels. Par exemple, un contrôleur RAID qui ne sera pas en mesure de donner des performances maximales dans une telle configuration, ou un nombre impair d'emplacements RAM dans des systèmes multiprocesseurs. Par conséquent, les ingénieurs vérifient d'abord la commande et si des problèmes potentiels sont identifiés, ils doivent avertir le client dans un ticket.
Si le client accepte que la configuration n'est pas optimale, vous pouvez facilement annuler la commande et en créer une nouvelle. Les fonds en cas d'annulation sont intégralement restitués au solde du panneau de contrôle. Après vérification de la commande, nous procédons à la préparation des composants et à l'assemblage du serveur.
Les accessoires
Chaque serveur comprend les composants suivants:
- boîtier (livré immédiatement avec une alimentation);
- carte mère ;
- mémoire à accès aléatoire ;
- processeurs
- lecteurs
- contrôleurs de disque (si disponibles dans la commande);
- cartes vidéo (si disponibles dans la commande).
L'ingénieur responsable de l'assemblage prépare tous les composants et les corrige dans le système comptable, en utilisant des numéros de série comme identifiants. Nous allons maintenant parler de toutes les étapes que traverse chaque serveur de configuration arbitraire.
Préparation des cas
Nous utilisons généralement des boîtiers Supermicro, qui doivent être préparés pour l'installation de la carte mère à l'aide du matériel fourni. Différents modèles de carte mère ont différents points de montage, vous devez donc déterminer le nombre de matériel et de boulons pour chaque assemblage spécifique.
Bien que le nombre de commandes ait été faible, nous avons simplement pris un ensemble de fixations conçues pour le boîtier et retiré les fixations inutilisées. À un certain moment, il est devenu clair qu'il fallait très longtemps pour trouver le bon boulon et nous avons décidé d'emballer tout le matériel disponible dans l'entrepôt.
Fixations préemballéesAprès l'emballage du dernier paquet avec attaches, il est devenu clair que nous n'avons pas fait ce travail en vain. Maintenant, chaque boulon et chaque matériel se trouve dans un endroit strictement désigné pour cela, ce qui permet d'économiser énormément de temps.
Afin d'empêcher les contacts de la carte mère de toucher le boîtier métallique et les courts-circuits, une couche plastique spéciale est utilisée. Sans cela, le montage est interdit. De plus, vous devez soigneusement séparer (oui, il est fourni par le fabricant) les ports pour les ports du stub à l'arrière du serveur. Elle est réalisée élémentairement avec un tournevis plat.
Après cela, des autocollants avec l'identifiant de la commande, ainsi que le numéro de série du futur serveur, sont appliqués sur le boîtier. Pour plus de commodité, en plus de l'identifiant alphanumérique, les étiquettes contiennent des codes-barres qui vous permettent de lire rapidement des informations à l'aide d'un scanner.
Installation de la carte mère
Immédiatement avant d'installer la carte mère, les ingénieurs effectuent certaines étapes préparatoires:
- mettre des gants fins;
- mettre un bracelet de mise à la terre.
Tout d'abord, cela est nécessaire pour ne pas endommager les mains. La blessure la plus courante dans ce cas est les coupures. Un bracelet de terre ne permettra pas d'endommager accidentellement les composants électroniques de la carte en raison de l'électricité statique.
Une fois la carte mère mise en place, les boulons de fixation sont serrés. Il faut se rappeler que la textolite est assez fragile, et ne fait pas d'efforts excessifs. Pour gagner du temps, les ingénieurs utilisent des tournevis sans fil.
Maintenant, les câbles d'alimentation sont connectés à la carte mère, ainsi qu'aux ventilateurs du système de refroidissement. Il est important que parfois la longueur des câbles soit plus longue que nécessaire, afin qu'ils soient soigneusement tirés ensemble avec de fines attaches en nylon. S'il n'est pas possible de fixer la chape au corps, le fabricant fournit des patins de montage pratiques sur du ruban adhésif double face. Les extrémités sont soigneusement mordues avec des couteaux latéraux.
Le panneau avant et le fond de panier sont ensuite connectés à l'aide des câbles appropriés. Vous pouvez maintenant procéder à l'installation de processeurs et d'autres éléments.
Installation du CPU
Cette opération est peut-être la plus subtile et demande de l'attention. Il y a encore 10 ans, les processeurs avaient des «pieds» pratiques et les prises étaient une matrice en plastique avec des trous. Grâce à cela, il suffisait juste d'insérer soigneusement le processeur dans le socket et de fermer le loquet. En commençant par la prise LGA 775, les processeurs ont perdu leurs «jambes», ne laissant que des plots de contact lisses. Les sockets, au contraire, ont maintenant des contacts, mais ils sont si petits et fragiles que toute opération avec l'installation du processeur doit être aussi précise que possible.
Prise contemporaine FCLGA3647
Processeur évolutif Intel XeonUne fois les processeurs installés à leur place, c'est au tour d'installer des radiateurs de refroidissement. En règle générale, des radiateurs passifs sont utilisés, mais avant cela, une graisse thermique est appliquée - une couche de matériau conducteur de chaleur qui sépare le processeur et le radiateur. Le plus souvent, une pâte d'organosilicium telle que KPT-8 est utilisée pour cela.
Il convient de rappeler que la tâche principale de la pâte thermique est de fermer les défauts microscopiques à la fois sur la surface du processeur et sur la surface du radiateur, offrant la plus grande zone de contact possible. Par conséquent, il est appliqué en une couche très fine et uniforme. Pour ce faire, utilisez une spatule spéciale ou la carte en plastique inutile à l'ancienne. Les excès sont éliminés avec des cotons-tiges.
Installation de RAM
Chaque fabricant de carte mère détermine indépendamment l'ordre d'installation correct des modules RAM, en fonction de son type et de sa vitesse. Pour Supermicro, cette procédure d'installation est décrite dans les instructions de chaque modèle de carte mère. Néanmoins, il existe plusieurs règles assez universelles qui fonctionnent dans la plupart des cas:
- il n'est pas souhaitable d'utiliser un nombre impair de lamelles (pertinent pour les processeurs Intel Xeon de la gamme E5);
- la mémoire doit être allouée canal par canal afin que le système puisse utiliser tous les modes de mécanismes de commande possibles;
- dans un serveur, il est souhaitable d'utiliser une mémoire avec la même latence, tension et fréquence dans la plage prise en charge par la carte mère.
Avant l'installation, les ingénieurs vérifient qu'il n'y a pas de particules étrangères de poussière ou de papier dans les fentes. Si nécessaire, de l'air comprimé est utilisé pour le nettoyage.
Installation du lecteur
Ici, tout est simple. Les lecteurs de disque sont fixés dans des patins standard, puis insérés dans le serveur. Si des contrôleurs de disque ou des cartes réseau supplémentaires ont été commandés, ils sont installés dans les logements PCI-E correspondants et fixés avec des vis. Une fois que tout est installé à sa place, l'ingénieur du service d'assemblage vérifie à nouveau la conformité de tous les composants avec la commande et envoie le serveur sur le stand pour le firmware et les tests.
Gestion des câbles
Nous abordons des sujets tels que la gestion des câbles à l'intérieur du serveur. Ici aussi, ont leurs propres nuances, dont la principale est l'espace limité. La plupart des serveurs sont conçus pour occuper un espace rack minimal. La hauteur d'une unité de montage est de 43,7 mm. Pour cette raison, l'espace pour les câbles après l'installation de la carte mère et d'autres périphériques est assez petit.
Fait amusant: une unité de montage en hauteur est exactement égale à un sommet (ancienne unité de longueur russe).
Vous devez toujours considérer que l'air doit traverser le serveur sans entrave pour refroidir efficacement les composants. Tout obstacle sur son chemin aggravera la dissipation thermique et, par conséquent, augmentera la consommation d'énergie en raison de la charge accrue sur le système de refroidissement. Ceci est particulièrement important pour les serveurs avec plusieurs GPU, dont la température sous charge atteint 80 degrés.
Le flux d'air est divisé également entre tous les GPUPar conséquent, tous les câbles sont posés de manière à ne pas bloquer le passage de l'air. Les excédents à l'aide de liens sont fixés aux yeux réguliers et, en cas d'absence, aux plates-formes en plastique avec du ruban adhésif double face.
Les câbles sont posés de manière à ne pas gêner le passage du flux d'airMicrologiciel des composants
Pour commencer, nous répondrons à une question fréquemment posée - pourquoi est-ce nécessaire? La réponse est simple - cette procédure est nécessaire pour garantir que tous les composants du serveur fonctionnent sans erreur, ainsi que pour augmenter le niveau de sécurité.
La plupart des composants serveur sont conçus dans l'espoir qu'ils peuvent être reprogrammés. Après avoir quitté la chaîne de montage pendant les tests et le fonctionnement, dans la plupart des cas, des erreurs et des vulnérabilités logicielles sont détectées. Si la possibilité de reprogrammer les composants n'était pas prévue, pour éliminer ces problèmes logiciels, tous les produits devraient être rappelés. Il était beaucoup moins cher de créer la possibilité de remplacer le firmware.
IPMI clignotant
Le module de contrôle à distance (IPMI / iLO / iDrac) est l'un des éléments les plus importants du serveur. Il s'agit d'un micro-ordinateur indépendant, qui fonctionne toujours lorsqu'il y a une tension de fonctionnement sur la carte mère.
Même lorsqu'il n'y a aucun composant dans le serveur, ce micro-ordinateur fonctionne, effectuant la tâche d'interpréter et d'ajuster les données des capteurs du serveur. Le module est étroitement connecté à tous les sous-systèmes de gestion de l'alimentation et vous permet d'effectuer presque toutes les opérations à distance. Par conséquent, le problème de la sécurité lors de l'accès à un tel appareil est très aigu. La mise à jour du firmware en temps opportun vous permet de protéger le module contre le piratage.
L'installation du micrologiciel se fait généralement directement à partir de l'interface Web, mais dans certains cas, elle peut être effectuée sur le réseau en envoyant le micrologiciel avec le logiciel approprié au module.
Flashage du BIOS
Le système d'E / S de base, en plus du motif de sécurité déjà mentionné, nécessite une mise à jour pour un autre point important. Le micrologiciel du BIOS contient des microcodes pour les processeurs pris en charge par la carte mère, ainsi que des microcodes pour les interfaces réseau et les chipsets. Lorsqu'une nouvelle version du processeur sort, les fabricants de cartes mères publient de nouvelles versions de firmware contenant le microcode requis. Sans cela, le nouveau processeur ne peut tout simplement pas démarrer.
En outre, la sortie du nouveau firmware empêche les conflits résultant de l'interaction de divers composants (à la fois intégrés à la carte mère et aux appareils tiers). Avec le micrologiciel du BIOS, les modules connexes, tels que Intel ME (Management Engine), sont souvent mis à jour.
Afin de ne pas être infondé, nous donnons un exemple. Prenez les cartes mères Supermicro X10SRi / X10DRi / X10DRW qui prennent en charge les processeurs Intel Xeon E5-XXXXv3. Si vous y mettez le processeur de la prochaine version E5-XXXXv4, la carte démarre, cependant, elle produira d'étranges erreurs de la RAM «Failing DIMM» dans différents emplacements. Et le problème ici n'est pas du tout dans la mémoire, mais dans le fait que le contrôleur de mémoire est situé dans le processeur. Par conséquent, une reconnaissance incorrecte du processeur par la carte mère conduit au fait que des problèmes similaires se posent. Flasher avec un processeur pris en charge résout complètement cette situation.
Dans certains cas, les fabricants d'équipements arrêtent artificiellement la prise en charge des équipements plus anciens avec des modèles de carte mère plus récents. Un exemple frappant est la carte mère Supermicro X11DPi, qui, quelle que soit la version du micrologiciel du BIOS,
ne fonctionnera pas avec les adaptateurs de bus hôte
Adaptec 7e série . Le contrôleur de disque ne s'initialise tout simplement pas, ce qui provoque le gel complet du serveur. Et pour le moment, ce problème n'a pas de solution.
Contrôleurs de disque clignotants
Les erreurs dans le logiciel de périphériques aussi importants que les contrôleurs de disque peuvent non seulement causer des problèmes, mais aussi devenir une source de très gros problèmes. Dans la plupart des cas, le processus est très simple, le clignotement se produit à l'aide de l'utilitaire natif, intégré directement dans le contrôleur lui-même.
Il ne faut pas oublier que l'ancien firmware du contrôleur de disque peut non seulement corriger les erreurs, mais aussi changer radicalement la façon dont les métadonnées sont stockées. Afin d'éviter des situations désagréables et de conserver les données intactes, il est impératif de lire la liste des modifications de la fonctionnalité avant d'effectuer un clignotement. Ces informations sont toujours présentes sur le site Web du fabricant de l’équipement et sont le plus souvent dupliquées dans les archives avec le firmware lui-même.
Cartes réseau clignotantes
Des problèmes non moins graves, extrêmement difficiles à diagnostiquer, peuvent fournir des cartes réseau avec des erreurs au niveau du firmware. Outre le dépannage, le logiciel de la carte réseau peut affecter directement les performances. C'est donc un autre élément obligatoire pour les ingénieurs qui construisent les serveurs.
Est important
Je voudrais noter séparément que toutes les opérations sur les composants de solin sont potentiellement dangereuses pour l'équipement, il est donc permis de les effectuer uniquement par des spécialistes qualifiés. Si vous êtes déjà notre client et avez découvert la nécessité de reflasher n'importe quel composant serveur, n'essayez
en aucun cas de le faire vous-même . Écrivez-nous simplement dans le ticket quel composant doit être reflasher, et cela sera fait avec toutes les précautions.
Test
Une fois la mise à jour du logiciel terminée, l'ingénieur assembleur procède à des tests de résistance sur le serveur assemblé. Ces tests vous permettent d'identifier la plupart des problèmes avant même que le serveur ne soit remis au client.
Test RAM
Afin de vérifier l'opérabilité de tous les modules RAM installés sur le serveur, un outil très populaire appelé memtester est lancé. Immédiatement avant le test, l'ingénieur de construction vérifie que tous les modules de mémoire installés sur le serveur sont correctement affichés dans le BIOS.
Lorsque le test est lancé, le processus de lecture et d'écriture des données dans la RAM se déroule en utilisant une séquence de données différente et l'ordre dans lequel les cellules sont remplies. La vitesse d'exécution de tous les tests dépend directement du volume. Nos exigences minimales sont un cycle d'inspection complet.
Si des erreurs sont détectées pendant le processus de test, nous recherchons un module RAM défaillant et l'excluons de la configuration, en le remplaçant par un similaire. Ensuite, le processus de test est répété dans son intégralité. Ce n'est que lorsque toutes les itérations de test sont terminées sans erreur, que le serveur passe aux tests de résistance.
Test CPU et disque
Le test de charge simule la charge maximale sur le serveur pendant au moins 6 heures pour un serveur avec des lecteurs magnétiques. Dans le cas des disques SSD, un test aussi long peut considérablement augmenter l'usure du disque, un test similaire est donc effectué pour eux avec un temps d'exécution plus court.
Le test de charge des processeurs Intel est effectué à l'aide de l'utilitaire Intel IPDT (Processor Diagnostic Tool) d'origine. Ce processus fait monter la température du processeur jusqu'à la température de fonctionnement maximale autorisée et le système de refroidissement doit éliminer efficacement toute cette chaleur. Les ingénieurs d'assemblage s'assurent constamment que le serveur passe ce test et que la température de tous les composants ne dépasse pas les limites de fonctionnement déclarées.
Une fois le test terminé, les paramètres SMART de tous les lecteurs installés sont vérifiés. Si au moins un paramètre déclaré par le fabricant comme motif de remplacement du lecteur est différent de zéro, le disque est remplacé par un autre et est également testé pour éliminer la probabilité de problèmes en "mode combat".
Conclusion
Chaque serveur de toute configuration louée par nous est vérifié et testé plusieurs fois, de sorte qu'il peut être utilisé en toute sécurité pour tous les projets à la fois, sans perdre de temps sur des tests et des vérifications répétés. Chaque serveur commandé aura la version de firmware la plus récente de chaque composant, ce qui offre une bonne protection contre les vulnérabilités et les erreurs existantes.
Parlez-nous de votre expérience dans la création ou le test de serveurs. Quelles fonctionnalités intéressantes avez-vous rencontrées? En attente de vos histoires dans les commentaires.