
Was passiert, wenn unser Client einen beliebigen Konfigurationsserver bestellt? Wie zuverlässig sind kundenspezifische Server? Wir werden diese und andere Themen heute in einem neuen Artikel ausführlich diskutieren.
Serverreihenfolge
Trotz der Tatsache, dass im Abschnitt zum Bestellen von Servern mehrere Dutzend verschiedene Konfigurationen verfügbar sind, benötigen einige Clients Server mit speziellen Konfigurationen. In den meisten Fällen ist dies erforderlich, um einen Server mit sehr hoher Leistung oder mit einer großen Anzahl von Festplatten zu erstellen.
Um diesen Bedarf zu decken, wurde der Dienst "
Dedizierter Server mit beliebiger Konfiguration " bereitgestellt. Mit dem Konfigurator auf der Site können Sie einen Server beliebiger Komplexität erstellen und in wenigen Minuten für sich selbst mieten. Allerdings fragen sich nur wenige, wie diese Server zusammengesetzt sind.
Nachdem sich der Kunde für die gewünschte Konfiguration entschieden, eine Bestellung aufgegeben und diese bezahlt hat, erstellt das System automatisch ein Ticket in der Systemsteuerung. Ein solches Ticket geht an die Montageabteilung, und Spezialisten beginnen, die Bestellung und tatsächlich die Servermontage selbst zu überprüfen.
Montageprozess
Bestellscheck
Der Konfigurator auf der Site wählt am häufigsten die „richtige“ Version der Komponenten aus. In einigen Fällen wählen Kunden jedoch möglicherweise nicht die optimalste Option zum Kombinieren von Hardwarekomponenten. Zum Beispiel ein RAID-Controller, der in einer solchen Konfiguration keine maximale Leistung erbringen kann, oder eine ungerade Anzahl von RAM-Steckplätzen in Multiprozessorsystemen. Daher überprüfen die Ingenieure zunächst die Bestellung. Wenn potenzielle Probleme festgestellt werden, müssen sie den Kunden in einem Ticket warnen.
Wenn der Kunde zustimmt, dass die Konfiguration nicht optimal ist, können Sie die Bestellung einfach stornieren und eine neue erstellen. Bei Stornierung werden die Beträge vollständig auf den Restbetrag des Kontrollfelds zurückgeführt. Nachdem die Bestellung überprüft wurde, fahren wir mit der Vorbereitung der Komponenten und der Montage des Servers fort.
Zubehör
Jeder Server besteht aus folgenden Komponenten:
- Fall (kommt sofort mit einem Netzteil);
- Motherboard ;
- Direktzugriffsspeicher ;
- Prozessoren
- Laufwerke
- Plattencontroller (falls in der Bestellung verfügbar);
- Grafikkarten (falls in der Bestellung verfügbar).
Der für die Montage verantwortliche Techniker bereitet alle Komponenten vor und repariert sie im Abrechnungssystem unter Verwendung von Seriennummern als Kennungen. Jetzt werden wir über alle Phasen berichten, die jeder Server mit beliebiger Konfiguration durchläuft.
Fallvorbereitung
Wir verwenden normalerweise Supermicro-Gehäuse, die für die Installation des Motherboards mit der mitgelieferten Hardware vorbereitet werden sollten. Verschiedene Motherboard-Modelle haben unterschiedliche Montagepunkte. Daher sollten Sie die Anzahl der Hardware und Schrauben für jede bestimmte Baugruppe bestimmen.
Obwohl die Anzahl der Bestellungen gering war, haben wir nur einen Satz Befestigungselemente für den Koffer genommen und unbenutzte Befestigungselemente entfernt. Ab einem bestimmten Punkt wurde klar, dass es sehr lange dauert, den richtigen Bolzen zu finden, und wir beschlossen, die gesamte im Lager verfügbare Hardware einzupacken.
Vorverpackte BefestigungselementeNachdem das letzte Paket mit Befestigungselementen verpackt worden war, wurde klar, dass wir diese Arbeit nicht umsonst erledigt haben. Jetzt liegt jeder Bolzen und jede Hardware an einem genau dafür vorgesehenen Ort, was sehr viel Zeit spart.
Um zu verhindern, dass die Kontakte des Motherboards das Metallgehäuse berühren und kurzschließen, wird eine spezielle Kunststoffschicht verwendet. Ohne sie ist die Montage verboten. Außerdem müssen Sie die Ports für die Ports im Stub auf der Rückseite des Servers sorgfältig aufteilen (ja, dies wird vom Hersteller bereitgestellt). Es wird elementar mit einem flachen Schraubendreher durchgeführt.
Danach werden Aufkleber mit der Bestellnummer sowie der Seriennummer des zukünftigen Servers auf den Fall aufgebracht. Zusätzlich zur alphanumerischen Kennung enthalten die Etiketten Barcodes, mit denen Sie Informationen mit einem Scanner schnell lesen können.
Motherboard-Installation
Unmittelbar vor der Installation des Motherboards führen die Ingenieure einige vorbereitende Schritte aus:
- ziehe dünne Handschuhe an;
- ein Erdungsarmband anlegen.
Dies ist zunächst erforderlich, um die Hände nicht zu beschädigen. Die häufigste Verletzung in diesem Fall sind Schnitte. Ein Erdarmband erlaubt keine versehentliche Beschädigung der elektronischen Komponenten der Platine durch statische Elektrizität.
Nach dem Einsetzen des Motherboards werden die Befestigungsschrauben festgezogen. Es sollte daran erinnert werden, dass der Textolit ziemlich zerbrechlich ist und keine übermäßigen Anstrengungen unternimmt. Um Zeit zu sparen, verwenden Ingenieure Akku-Schraubendreher.
Jetzt werden Stromkabel an das Motherboard sowie Lüfter des Kühlsystems angeschlossen. Es ist wichtig, dass die Kabel manchmal länger als nötig sind, damit sie mit dünnen Nylonbindern sauber zusammengezogen werden. Wenn es nicht möglich ist, den Estrich am Gehäuse zu befestigen, liefert der Hersteller praktische Montagepads auf doppelseitigem Klebeband. Die Enden werden sorgfältig mit Seitenschneidern abgebissen.
Dann werden die Frontplatte und die Rückwandplatine mit den entsprechenden Kabeln verbunden. Jetzt können Sie mit der Installation von Prozessoren und anderen Elementen fortfahren.
CPU-Installation
Diese Operation ist vielleicht die subtilste und erfordert Aufmerksamkeit. Noch vor 10 Jahren hatten Prozessoren praktische „Beine“, und Sockel waren eine Kunststoffmatrix mit Löchern. Dank dessen genügte es, den Prozessor vorsichtig in den Sockel einzusetzen und die Verriegelung zu schließen. Beginnend mit der LGA 775-Buchse verloren die Prozessoren ihre „Beine“ und hinterließen nur glatte Kontaktflächen. Im Gegensatz dazu haben Sockets jetzt Kontakte, aber sie sind so klein und zerbrechlich, dass jeder Vorgang mit der Installation des Prozessors so genau wie möglich sein sollte.
Zeitgenössische Buchse FCLGA3647
Intel Xeon Skalierbarer ProzessorNachdem die Prozessoren an ihren Plätzen installiert wurden, müssen Sie Kühlkörper installieren. In der Regel werden passive Heizkörper verwendet, vorher wird jedoch Wärmeleitpaste aufgetragen - eine Schicht aus wärmeleitendem Material, die den Prozessor und den Heizkörper voneinander trennt. Am häufigsten wird hierfür eine Organosiliciumpaste wie KPT-8 verwendet.
Es ist zu beachten, dass die Hauptaufgabe der Wärmeleitpaste darin besteht, mikroskopische Defekte sowohl auf der Oberfläche des Prozessors als auch auf der Oberfläche des Kühlers zu schließen und so die größtmögliche Kontaktfläche bereitzustellen. Daher wird es in einer sehr dünnen und gleichmäßigen Schicht aufgetragen. Verwenden Sie dazu entweder einen speziellen Spatel oder die altmodische unnötige Plastikkarte. Überschüsse werden mit Wattestäbchen entfernt.
RAM-Installation
Jeder Motherboard-Hersteller bestimmt unabhängig von Typ und Geschwindigkeit die richtige Installationsreihenfolge der RAM-Module. Für Supermicro wird dieses Installationsverfahren in den Anweisungen für jedes Modell des Motherboards beschrieben. Trotzdem gibt es einige ziemlich universelle Regeln, die in den meisten Fällen funktionieren:
- Es ist unerwünscht, eine ungerade Anzahl von Lamellen zu verwenden (relevant für Intel Xeon-Prozessoren in der E5-Reihe).
- Der Speicher sollte kanalweise zugewiesen werden, damit das System alle möglichen Modi von Steuermechanismen verwenden kann.
- Auf einem Server ist es wünschenswert, Speicher mit der gleichen Latenz, Spannung und Frequenz in dem Bereich zu verwenden, den das Motherboard unterstützt.
Vor der Installation prüfen die Ingenieure, ob sich keine Fremdkörper aus Staub oder Papier in den Steckplätzen befinden. Bei Bedarf wird zur Reinigung Druckluft verwendet.
Installation des Laufwerks
Hier ist alles einfach. Festplatten werden in Standard-Skids repariert und dann in den Server eingelegt. Wenn Festplattencontroller oder zusätzliche Netzwerkkarten bestellt wurden, werden diese in den entsprechenden PCI-E-Steckplätzen installiert und mit Schrauben gesichert. Nachdem alles an seinem Platz installiert wurde, überprüft der Ingenieur der Montageabteilung erneut die Übereinstimmung aller Komponenten mit der Bestellung und sendet den Server zur Firmware und zum Testen an den Stand.
Kabelmanagement
Wir gehen auf Themen wie Kabelmanagement im Server ein. Auch hier haben sie ihre eigenen Nuancen, deren Hauptgrund der begrenzte Raum ist. Die meisten Server sind so konzipiert, dass sie nur minimalen Rack-Platz beanspruchen. Die Höhe einer Montageeinheit beträgt 43,7 mm. Aus diesem Grund ist der Platz für Kabel nach der Installation des Motherboards und anderer Peripheriegeräte recht klein.
Unterhaltsame Tatsache: Eine Montageeinheit in der Höhe entspricht genau einem Scheitelpunkt (altrussische Längeneinheit).
Sie sollten immer berücksichtigen, dass Luft ungehindert durch den Server strömen muss, um die Komponenten effektiv zu kühlen. Hindernisse auf dem Weg verschlechtern die Wärmeableitung und erhöhen folglich den Energieverbrauch aufgrund der erhöhten Belastung des Kühlsystems. Dies ist besonders wichtig für Server mit mehreren GPUs, deren Temperatur unter Last 80 Grad erreicht.
Der Luftstrom wird gleichmäßig auf alle GPUs aufgeteiltDaher sind alle Kabel so verlegt, dass der Luftdurchgang nicht blockiert wird. Überschüsse werden mit Hilfe von Bindungen an normalen Augen und bei Abwesenheit an Kunststoffplattformen mit doppelseitigem Klebeband befestigt.
Kabel werden so verlegt, dass der Luftstrom nicht beeinträchtigt wirdKomponenten-Firmware
Zunächst werden wir eine häufig gestellte Frage beantworten - warum wird dies benötigt? Die Antwort ist einfach: Dieses Verfahren ist erforderlich, um sicherzustellen, dass alle Serverkomponenten fehlerfrei funktionieren, und um das Sicherheitsniveau zu erhöhen.
Die meisten Serverkomponenten werden mit der Erwartung erstellt, dass sie neu programmiert werden können. Nach dem Verlassen der Montagelinie während des Testens und Betriebs werden in den meisten Fällen Fehler und Software-Schwachstellen erkannt. Wenn die Möglichkeit einer Neuprogrammierung der Komponenten nicht gegeben wäre, müssten alle Produkte zurückgerufen werden, um diese Softwareprobleme zu beseitigen. Es war viel billiger, die Möglichkeit zu schaffen, Firmware zu ersetzen.
IPMI blinkt
Das Fernbedienungsmodul (IPMI / iLO / iDrac) ist eines der wichtigsten Elemente des Servers. Es ist ein unabhängiger Mikrocomputer, der immer funktioniert, wenn auf der Hauptplatine Betriebsspannung anliegt.
Selbst wenn der Server keine Komponenten enthält, funktioniert dieser Mikrocomputer und übernimmt die Interpretation und Anpassung der Daten von Serversensoren. Das Modul ist eng mit allen Energieverwaltungssubsystemen verbunden und ermöglicht es Ihnen, nahezu jeden Vorgang aus der Ferne auszuführen. Daher ist das Problem der Sicherheit beim Zugriff auf ein solches Gerät sehr akut. Durch die rechtzeitige Aktualisierung der Firmware können Sie das Modul vor Hacking schützen.
Die Installation der Firmware erfolgt normalerweise direkt über die Weboberfläche. In einigen Fällen kann dies jedoch über das Netzwerk erfolgen, indem die Firmware mit der entsprechenden Software an das Modul gesendet wird.
BIOS blinkt
Das grundlegende E / A-System muss zusätzlich zu den bereits aufgeführten Sicherheitsgründen für einen weiteren wichtigen Punkt aktualisiert werden. Die BIOS-Firmware enthält Mikrocodes für Prozessoren, die vom Motherboard unterstützt werden, sowie Mikrocodes für Netzwerkschnittstellen und Chipsätze. Wenn eine neue Version des Prozessors herauskommt, veröffentlichen Motherboard-Hersteller neue Firmware-Versionen, die den erforderlichen Mikrocode enthalten. Ohne dies kann der neue Prozessor einfach nicht gestartet werden.
Darüber hinaus verhindert die Veröffentlichung neuer Firmware Konflikte, die durch das Zusammenspiel verschiedener Komponenten (sowohl in das Motherboard als auch in Geräte von Drittanbietern integriert) entstehen. Neben der BIOS-Firmware werden häufig verwandte Module wie Intel ME (Management Engine) aktualisiert.
Um nicht unbegründet zu sein, geben wir ein Beispiel. Nehmen Sie Supermicro X10SRi / X10DRi / X10DRW-Motherboards, die Intel Xeon E5-XXXXv3-Prozessoren unterstützen. Wenn Sie den Prozessor der nächsten Version E5-XXXXv4 dort platzieren, startet die Karte, es entstehen jedoch merkwürdige Fehler des RAM „Failing DIMM“ in verschiedenen Steckplätzen. Und das Problem liegt hier überhaupt nicht im Speicher, sondern darin, dass sich der Speichercontroller im Prozessor befindet. Eine falsche Erkennung des Prozessors durch das Motherboard führt daher dazu, dass ähnliche Probleme auftreten. Das Flashen mit einem unterstützten Prozessor löst diese Situation vollständig.
In einigen Fällen stellen Gerätehersteller die Unterstützung älterer Geräte mit neueren Motherboard-Modellen künstlich ein. Ein bemerkenswertes Beispiel ist das Supermicro X11DPi-Motherboard, das mit keiner Version der BIOS-Firmware
mit HBAs der 7. Adaptec-Serie funktioniert . Der Festplattencontroller wird einfach nicht initialisiert, wodurch der Server vollständig einfriert. Und im Moment hat dieses Problem keine Lösung.
Flashende Festplattencontroller
Fehler in der Software so wichtiger Geräte wie Festplattencontroller können nicht nur Probleme verursachen, sondern auch zu sehr großen Problemen führen. In den meisten Fällen ist der Vorgang sehr einfach. Das Flashen erfolgt mit dem nativen Dienstprogramm, das direkt in den Controller selbst integriert ist.
Es ist zu beachten, dass die alte Firmware des Festplattencontrollers nicht nur Fehler beheben, sondern auch die Art und Weise, wie Metadaten gespeichert werden, radikal ändern kann. Um unangenehme Situationen zu vermeiden und die Daten intakt zu halten, muss unbedingt die Liste der an der Funktionalität vorgenommenen Änderungen gelesen werden, bevor ein Flashen durchgeführt wird. Diese Informationen sind immer auf der Website des Geräteherstellers vorhanden und werden meistens im Archiv mit der Firmware selbst dupliziert.
Blinkende Netzwerkkarten
Nicht weniger schwerwiegende Probleme, die äußerst schwer zu diagnostizieren sind, können Netzwerkkarten mit Fehlern auf Firmware-Ebene liefern. Zusätzlich zur Fehlerbehebung kann die Netzwerkkartensoftware die Leistung direkt beeinflussen. Dies ist also ein weiteres obligatorisches Element für Ingenieure, die die Server erstellen.
Ist wichtig
Ich möchte separat darauf hinweisen, dass alle Arbeiten an blinkenden Bauteilen potenziell gefährlich für das Gerät sind. Daher ist es zulässig, sie nur von qualifizierten Fachleuten durchzuführen. Wenn Sie bereits unser Client sind und festgestellt haben, dass eine Serverkomponente neu gestartet
werden muss, versuchen Sie es auf keinen Fall selbst . Schreiben Sie uns einfach im Ticket, welche Komponente neu geflasht werden soll, und dies erfolgt mit allen Vorsichtsmaßnahmen.
Testen
Nach Abschluss des Software-Updates fährt der Montagetechniker mit dem Stresstest des zusammengebauten Servers fort. Mit solchen Tests können Sie die meisten Probleme identifizieren, noch bevor der Server an den Client übergeben wird.
RAM-Test
Um die Funktionsfähigkeit aller auf dem Server installierten RAM-Module zu überprüfen, wird ein sehr beliebtes Tool namens memtester gestartet. Unmittelbar vor dem Testen überprüft der Build-Techniker, ob alle auf dem Server installierten Speichermodule im BIOS korrekt angezeigt werden.
Wenn der Test gestartet wird, erfolgt das Lesen und Schreiben von Daten in den RAM unter Verwendung einer anderen Datensequenz und der Reihenfolge, in der die Zellen gefüllt werden. Die Ausführungsgeschwindigkeit aller Tests hängt direkt vom Volumen ab. Unsere Mindestanforderungen sind ein vollständiger Inspektionszyklus.
Wenn während des Testprozesses Fehler festgestellt werden, suchen wir nach einem ausgefallenen RAM-Modul und schließen es aus der Konfiguration aus, indem wir es durch ein ähnliches ersetzen. Dann wird der Testvorgang vollständig wiederholt. Erst wenn alle Testiterationen fehlerfrei abgeschlossen sind, geht der Server zum Stresstest.
CPU- und Festplattentest
Der Auslastungstest simuliert die maximale Auslastung des Servers für mindestens 6 Stunden für einen Server mit Magnetantrieben. Bei Solid-State-Laufwerken kann ein so langer Test den Verschleiß des Laufwerks erheblich erhöhen, sodass für sie ein ähnlicher Test mit einer kürzeren Ausführungszeit durchgeführt wird.
Lasttests für Intel-Prozessoren werden mit dem ursprünglichen Intel IPDT-Dienstprogramm (Processor Diagnostic Tool) durchgeführt. Dieser Prozess bewirkt, dass die Prozessortemperatur auf die maximal zulässige Betriebstemperatur ansteigt und das Kühlsystem diese gesamte Wärme effektiv abführen muss. Montagetechniker stellen ständig sicher, dass der Server diesen Test besteht und die Temperatur aller Komponenten die angegebenen Betriebsgrenzen nicht überschreitet.
Nach Abschluss des Tests werden die SMART-Einstellungen aller installierten Laufwerke überprüft. Wenn mindestens ein vom Hersteller als Grund für den Austausch des Laufwerks angegebener Parameter ungleich Null ist, wird die Festplatte durch einen anderen ersetzt und auch getestet, um die Wahrscheinlichkeit von Problemen im "Kampfmodus" auszuschließen.
Fazit
Jeder Server einer von uns geleasten Konfiguration wird viele Male überprüft und getestet, sodass er sicher für alle Projekte gleichzeitig verwendet werden kann, ohne Zeit für wiederholte Tests und Überprüfungen zu verschwenden. Jeder bestellte Server verfügt über die aktuellste Firmware-Version jeder Komponente, die einen guten Schutz vor vorhandenen Schwachstellen und Fehlern bietet.
Erzählen Sie uns von Ihren Erfahrungen beim Erstellen oder Testen von Servern. Auf welche interessanten Funktionen sind Sie gestoßen? Warten auf Ihre Geschichten in den Kommentaren.