Wählen Sie einen Server. Was ist zu suchen? Checkliste



Meiner Meinung nach wird dem Thema der Auswahl eines Servers zu wenig Aufmerksamkeit geschenkt („sie sind alle für alle gleich“). Im Folgenden werde ich versuchen zu beschreiben, warum Sie dies nicht vernachlässigen sollten und worauf Sie wirklich achten müssen, und über Funktionen sprechen, die das Leben des Administrators vereinfachen und Geld sparen. Alles, was unten beschrieben wird, ist eine persönliche Meinung, die auf langjähriger Erfahrung basiert.

Wichtige Punkte bei der Auswahl eines Servers


Die Aufgaben


Der Haupt- und Hauptfaktor der Wahl ist die Art und Art der Ladung. Basierend darauf werden allgemeine Konfigurationsparameter ausgewählt: Anzahl und Eigenschaften der CPU, RAM-Größe, Parameter des Festplattensubsystems usw. Offensichtlich unterscheidet sich die Konfiguration des geladenen DBMS-Servers vom Domänencontroller oder Virtualisierungshost. Hier beginnen sie normalerweise mit den Systemanforderungen einer bestimmten Software für die erforderliche Last sowie mit der Erfahrung bei der Bewertung der erforderlichen Leistung für die erforderliche Software. Wenn wir über einige Tipps sprechen, ist es für den Virtualisierungshost besser, den Server mit der maximalen RAM-Größe für das Budget zu konfigurieren (er wird sowieso bald klein :)). Bei einem DBMS-Server ist es besser, auf die Prozessorleistung zu achten, und dies ist sowohl in IOPS als auch bei der minimalen Latenz des Festplattensubsystems sehr schnell (es sei denn, Sie planen natürlich die Verwendung lokaler Festplatten). Es sollte ein Dateispeicherserver mit einer großen Anzahl von Festplattensteckplätzen und einem anständigen RAID-Controller ausgewählt werden.

Erweiterbarkeit


Trotz der üblichen Praxis, beim Kauf eines Servers einen bestimmten Spielraum für die Merkmale hinzuzufügen, ist es nicht ungewöhnlich, dass eine ungeplante Erhöhung der Last mehr Ressourcen erfordert als vorhanden. In diesem Fall hilft die Vorsicht bei weiteren Upgrades dabei, die Kosten erheblich zu senken. Dies betrifft hauptsächlich die Größe des Arbeitsspeichers (die Anzahl der freien Steckplätze und die Kanalauslastung), die Anzahl der Festplatten und PCIe-Erweiterungsports zum Hinzufügen einer Art Netzwerkadapter, HBA, nVMe-SSD usw. Ich empfehle jedoch dringend, beispielsweise keinen Server mit zwei Sockets und einem Prozessor zu kaufen, da es häufig triviale Situationen gibt, in denen Sie (in den letzten Jahren) nur bei eBay einen zweiten Prozessor für ein Upgrade kaufen können. Geld sparen am Anfang wird zu einer Überzahlung. Viele Kunden stellen später möglicherweise fest, dass die Überarbeitung und die Schritte der Prozessoren unterschiedlich sind und es seltsame Probleme, Fehler und andere Probleme gibt, die jedoch normalerweise durch Aktualisierung des BIOS / UEFI auf die neueste Version behoben werden, sofern vorhanden. Und wenn Markenhardwareanbieter versuchen, die Firmware während des gesamten Server-Support-Zyklus zu aktualisieren, ist es im Fall einer selbst zusammengestellten Lösung und nahezu namenloser Komponentenhersteller (hauptsächlich Motherboards) durchaus möglich, bei nichts zu bleiben.

RAS


Zuverlässigkeit, Verfügbarkeit, Wartungsfreundlichkeit - der Begriff wurde von IBM eingeführt und beschreibt die Zuverlässigkeit des gesamten Systems, da er die Kontinuität der ihm anvertrauten Arbeit gewährleistet. Wenn ausreichend hohe RAS-Indikatoren erforderlich sind, lohnt es sich, in Richtung Maschinen seriöser Marken zu schauen, da diese diesen Merkmalen im Gegensatz zu Marken der unteren Preisklasse oder der Selbstmontage von Bauteilen große Aufmerksamkeit widmen.

Zuverlässigkeit (oder auf Russisch Zuverlässigkeit)


Dies impliziert die Fähigkeit des Systems, Fehler unabhängig zu beheben, ohne das Endergebnis zu beeinflussen. Diese Eigenschaft umfasst eine Vielzahl von Technologien, die in fast allen Komponenten verwendet werden: sowohl die typische Fehlererkennung in Prozessoranweisungen als auch die Benachrichtigung dieses Betriebssystems (z. B. MCA von Intel), Fehlerkorrektur im RAM (ECC, Scrubbing) und herstellerspezifische prädiktive Analyse auf Serviceprozessorebene (PFA).

Verfügbarkeit


Legt fest, wie lange sich das System im Verhältnis zur geplanten Zeit in einem fehlerfreien Zustand befindet. Die Verfügbarkeit steigt durch die Verwendung hochwertiger Komponenten, die Redundanz kritischer Geräte (Netzteile, Lüfter, HBA), den allgemeinen Sicherheitsfaktor des Servers für bestimmte Betriebsbedingungen. Desktop-SSDs unter Serverlast sind ein typisches Beispiel: Ja, es ist ungefähr so ​​schnell, ja, es ist ernsthaft billiger, aber wenn der DWPD-Schwellenwert (der bei Desktop-Laufwerken extrem niedrig ist) überschritten wird, fallen SSDs leicht aus, und es ist gut, wenn der Ansatz Administrator und Zusammenfluss der Umstände führten nur zu Ausfallzeiten und nicht zu Datenverlust.

Wartungsfreundlichkeit (Einfachheit und Servicegeschwindigkeit)


Es ermöglicht die Erhöhung der Verfügbarkeit im Falle eines Fehlers, der dennoch aufgrund einer schnellen Wiederherstellung aufgetreten ist. Hierzu werden eine Vielzahl von Hot-Swap-fähigen Komponenten verwendet, praktische Schienen mit der Möglichkeit der Wartung ohne Arbeitsunterbrechung sowie verschiedene Diagnoselösungen, die sowohl über das Netzwerk über den Serviceprozessor als auch auf dem Servergehäuse verfügbar sind. Mit ihnen können Sie eine ausgefallene Komponente schnell identifizieren. Einige Hersteller fügen Call Home-Funktionen hinzu, die dem technischen Support automatisch einen Fehler melden und so die Wiederherstellungszeit verkürzen. Wenn die Kritikalität der auf dem Server befindlichen Dienste hoch genug ist, lohnt es sich, RAS ernsthaft zu beachten.

Umgebungsbedingungen


Dies umfasst Leistungsparameter (Leistung und Effizienz des Netzteils), Kühlung (Qualität des Kühlsystems, Fähigkeit, bei erhöhten Temperaturen zu arbeiten, auch ohne Garantieverlust), Temperatursensoren im Gehäuse, Formfaktor (der sich auch auf die Leistung und Effizienz der Kühlung auswirkt - relevant bei hoher Dichte). Bei „heißen“ Komponenten (CPUs mit hoher TDP, GPU usw.) müssen Sie den kleinen Formfaktor nicht ohne die offensichtliche Notwendigkeit einer Platzierung mit hoher Dichte verfolgen. Es ist besser, etwas mit einer Größe von 2 HE oder mehr zu wählen.

Kompatibilität


Das Vorhandensein des Servers und der Komponenten in der HCL des richtigen Herstellers hilft, unangenehme Situationen zu vermeiden, die mit dem Start der Software verbunden sind. Außerdem kann eine Supportanfrage für einen Softwareanbieter entweder zu einem Ping-Pong zwischen Hardware- und Softwareanbietern werden und kann insgesamt abgelehnt werden, wenn sie auf nicht unterstützter Hardware gestartet wird. Im Großen und Ganzen ist es viel schöner, eine sofort einsatzbereite Lösung zu finden, als das Image des Hypervisors neu zu verpacken, um den Treiber des RAID-Controllers dort zu platzieren (dieses Beispiel verweist auf die Kompatibilität von ESXi- und Adaptec-Controllern, die formal vorhanden ist, jedoch vorläufige Liebkosungen erfordert). Wenn die Aufgabe und die Software Kompatibilität mit der Hardware erfordern, erfordert dieses Element eine sorgfältige Auswahl der Komponenten (bei Servern großer Hersteller ist aus dieser Sicht alles sehr einfach - sie sind in der HCL fast aller Softwareentwicklungsunternehmen vorhanden, entweder komponentenweise oder als Ganzes).

Management


Fast alle Server sind mit Fernbedienungen ausgestattet, die eine mit IPMI und / oder einer Webkonsole kompatible Schnittstelle bieten. Je nach Hersteller können die Controller verschiedene Funktionen haben, von der Bereitstellung von Images in einem Netzwerk über die automatische Installation des Betriebssystems und zentralisierte Firmware-Updates bis hin zu einem vollständigen Lebenszyklusmanagement, das die Inbetriebnahme neuer Server und deren weitere Wartung erheblich vereinfacht und beschleunigt. Der Grad der Aufmerksamkeit für diesen Artikel hängt von der Größe der Serverflotte und der Notwendigkeit einer bequemen Fernbedienung ab. Ehrlich gesagt habe ich in die Konfiguration immer optionale Lizenzen für zusätzliche Verwaltungsfunktionen eingefügt (mit Ausnahme von LCM, ohne ausdrücklich darauf hinzuweisen, dass dies erforderlich ist), da dies sehr praktisch ist und die einfache Wartung die Zeit erheblich verkürzt.

Leistung


Auf den ersten Blick ist dies ein seltsamer Punkt: Schließlich verwenden die Server verschiedener Hersteller dieselben Prozessoren, RAMs, Festplatten usw. Wenn Sie jedoch die Leistung von Servern verschiedener Hersteller in denselben Konfigurationen direkt messen, können Sie unterschiedliche Ergebnisse erzielen. Dies ist zunächst auf verschiedene Einstellungen und Optimierungen auf Firmware-Ebene zurückzuführen (ohne darauf beschränkt zu sein). Um das Leistungsniveau im Vergleich zu wettbewerbsfähigen Angeboten zu verstehen, können Sie sich auf Server-Benchmarks beziehen (z. B. VMmark von VMware).

Garantie & Service


Viele Anbieter bieten Servicepakete an, mit denen die Ursache eines Hardwarefehlers schnell erkannt und durch Austausch von Komponenten behoben werden kann. Pakete unterscheiden sich in Garantie- und Servicezeiten sowie Reaktions- und Wiederherstellungszeiten. Auch die Verfügbarkeit von Ersatzteilen in Servicelagern nach dem Entfernen eines bestimmten Modells aus der Produktion variiert. Bei der Selbstmontage müssen Sie entweder Ersatzteile aufbewahren oder sich in Bezug auf die Verfügbarkeit von Ersatzteilen im Lager und die Dauer ihrer Lieferung auf den Lieferanten / Monteur der Ausrüstung verlassen.

Fazit


Hier sind die wichtigsten Punkte, die Sie bei der Auswahl eines Servers beachten sollten. Ich hoffe, dass dies für jemanden nützlich ist und dazu beiträgt, häufige Fehler zu vermeiden. Wenn Sie weitere Fragen haben, schreiben Sie in die Kommentare.

Sie können auch unsere Kanäle ( YouTube , VK , Telegramm ) abonnieren, um neue Artikel, Kurse und Seminare nicht zu verpassen.

Source: https://habr.com/ru/post/de417601/


All Articles