So überprüfen Sie die Zuverlässigkeit des Rechenzentrums: 3 Hauptpunkte, auf die Sie achten müssen

Bei der Auswahl eines IaaS-Anbieters konzentrieren sich Unternehmen auf die Merkmale der Cloud. Sie bewerten die Verfügbarkeit, Skalierbarkeit usw. Die im Rechenzentrum installierte Hardware ist jedoch für die Leistung einer virtualisierten Umgebung verantwortlich. Die Zuverlässigkeit von Cloud-Diensten hängt größtenteils von dieser Infrastruktur (und dem Ort, an dem sie sich befindet) ab.

Heute haben wir uns entschlossen, Ihnen mitzuteilen, auf welche Punkte Sie bei der Bewertung der Parameter eines Rechenzentrums eines IaaS-Anbieters achten sollten.


/ Foto Arthur Caranta CC

Zuverlässigkeitsgrad und Redundanz


Bei der Bewertung des Rechenzentrums eines IaaS-Anbieters sollten Sie zunächst auf die Redundanz der technischen Infrastruktur, insbesondere der Stromversorgungssysteme, achten. Da dieser spezielle Parameter die Verfügbarkeit beeinflusst, dh die Zeit des kontinuierlichen Betriebs ohne Fehler.

Die Klassifizierung des Uptime Institute kann zur Bewertung der Redundanzstufen verwendet werden.

  • Tier 1 - In diesem Fall gibt es kein Redundanzschema (N). Die Zuverlässigkeit hängt von jedem einzelnen Element der Infrastruktur ab. Ein Ausfall eines Geräts führt zu Ausfallzeiten des gesamten Rechenzentrums.
  • Tier 2 - impliziert ein N + 1-Redundanzschema. Ein zusätzliches Element wird zu den N Infrastrukturelementen hinzugefügt, wodurch das Ausfallrisiko verringert wird.
  • Tier 3 - Redundanzschema auch N + 1, jedoch mit der Möglichkeit paralleler technischer Arbeiten.
  • Tier 4 - 2N Reservierung . Wenn jedes Element auf ähnliche Weise dupliziert wird.

Bei der Tier-Klassifizierung wird davon ausgegangen, dass Engineering-Systeme als eine Einheit betrachtet werden. Wenn mindestens eine der Komponenten nicht reserviert ist, wird die Fehlertoleranz der Benutzeroberfläche verringert. Je höher die Stufe, desto höher die Verfügbarkeit. Sie müssen jedoch verstehen, dass es in der Klassifizierung der Benutzeroberfläche keine "schlechtesten und besten" gibt. Dies bedeutet nicht, dass in allen Situationen eine Stufe ausreicht. Daher sollte die Auswahl eines Anbieters mit einem Rechenzentrum mit der einen oder anderen Redundanzstufe auf den Aufgaben des Unternehmens basieren.

Für große Unternehmen, deren Ausfallzeiten unerwünscht sind, ist es sinnvoll, auf Rechenzentren mit 2N-Redundanz zu achten. Dieser Weg führte beispielsweise zu Facebook. Das Rechenzentrum des Unternehmens in der schwedischen Stadt Lulea verfügt über eine 2N-Reservierung. Die Energiesysteme des Rechenzentrums Sberbank in Skolkovo sind ebenfalls reserviert .

In einigen Fällen kann ein solches System jedoch redundant sein. Denn je höher die Stufe, desto teurer ist es, die Ausrüstung eines Cloud-Anbieters zu mieten. Daher sollten Unternehmen, für die eine einfache IT-Infrastruktur und -Services eine Stunde pro Jahr nicht kritisch sind, ein Rechenzentrum mit einer kleineren Ebene wählen.

Beispielsweise platziert der IaaS-Anbieter IT-GRAD Geräte in den Rechenzentren DataSpace (Moskau) und Xelent (St. Petersburg). Dies ist ein Rechenzentrum mit einer Tier III-Klasse, dessen Ausfallzeit etwa eineinhalb Stunden pro Jahr beträgt. Sie machten eine Reservierung nach dem N + 1-Schema. Beispielsweise liefern an einem Standort in Moskau zwei Umspannwerke entlang sechs unabhängiger Leitungen eine kontinuierliche Stromversorgung . Im Rechenzentrum sind sechs unabhängige Transformatoren mit 2 MVA installiert , von denen jeder ein Anschlusspunkt eines unabhängigen Stromkreises ist.

Bei höherer Gewalt und Spannungsabfällen wirkt sich das mögliche Abschalten eines Stromversorgungszweigs nicht auf den Betrieb des gesamten Systems aus, da die gesamte Last auf den Backup-Zweig übertragen wird. Als "Fallback-Plan" gibt es automatische Dieselgeneratoren mit 6 Kraftstofftanks zu je 950 Litern. Bei voller Beladung bietet der Reservebestand dem Rechenzentrum 84 Stunden Dauerbetrieb.

Mikroklima


Der nächste wichtige Aspekt ist die Bewertung der Leistung der „Kühleinheiten“ des Rechenzentrums. Die Fähigkeit von Kühlsystemen, ein optimales Mikroklima im Maschinenraum aufrechtzuerhalten, beeinflusst die Zuverlässigkeit von „Eisen“, die Menge des verbrauchten Stroms und dementsprechend den Preis für die für die Platzierung der Ausrüstung erbrachten Dienstleistungen.

Zum Beispiel, wenn die Temperatur im Rechenzentrum von 22 ° C steigt . Bis zu 35 ° C steigt der Stromverbrauch des Servers um durchschnittlich 20%. Und wie Vertreter der ASHRAE Society of Engineers , die Kommunikationsstandards und Luftqualitätsbewertungen entwickelt, schreiben, können Temperaturen unter 18 ° C und über 27 ° C die Ausgangsleistung und Batterielebensdauer unterbrechungsfreier Stromversorgungssysteme erheblich reduzieren ( Seite 29 des Berichts ).

Sie müssen jedoch auch berücksichtigen, wie die erforderliche Temperatur im Rechenzentrum aufrechterhalten wird. Wenn der Wirkungsgrad des Kühlsystems gering ist, verbraucht es viel Strom. In einigen Fällen werden bis zu 40% des gesamten Energieverbrauchs des Rechenzentrums für die Klimatisierung aufgewendet . Dies wirkt sich wiederum auf die Ausrüstungsverleihrechnungen aus.

Um das Mikroklima und die Lufttemperatur im Rechenzentrum zu steuern, wird daher häufig die Technologie der "freien Kühlung" (oder der freien Kühlung) verwendet. Damit können Sie den Stromverbrauch senken. Nach den neuesten Daten verfügt das Xelent-Rechenzentrum über den besten Energieeffizienzindikator für das Rechenzentrum ( PUE ) auf dem russischen Markt - es betrug 1,29. Das Rechenzentrum von Google gilt in diesem Bereich als Rekordhalter. Dem IT-Riesen ist es gelungen, einen PUE- Wert von 1,11 zu erreichen .

Im Xelent-Rechenzentrum wird das Temperaturregime für alle IT-Geräte gemäß den Empfehlungen von ASHRAE eingehalten. Ein rotierender Wärmetauscher ist für das Mikroklima im Rechenzentrum verantwortlich. Dies ist ein großes Fünf-Meter-Rad, das die Wärmeübertragung von den Maschinenräumen des Rechenzentrums auf die Straße praktisch ohne Luftkonvektion ermöglicht.

Es muss auch berücksichtigt werden, wie im Rechenzentrum eine bestimmte Luftfeuchtigkeit bereitgestellt wird. Kondensation kann die Serverhardware schädigen und beschädigen. Wie beim ersten Facebook-Rechenzentrum in Primeville, wo Fehler im Betrieb des Mikroklimasystems dazu führten, dass Flüssigkeit in die Geräte gelangte. Im Serverraum begann "Kondensatregen" buchstäblich zu regnen. Die Ausrüstung musste dringend getrennt werden. ASHRAE stellt fest, dass die Luftfeuchtigkeit im Rechenzentrum 60% nicht überschreiten sollte . Bei Facebook lag dieser Wert bei 95%.


/ Foto Tim Dorr CC

Physische Sicherheit


Heute befinden sich Rechenzentren in unterirdischen Bunkern, deren Eingang von bewaffneten Soldaten bewacht wird. Es gibt Rechenzentren, die vor nuklearen Explosionen oder EMP geschützt sind. Am häufigsten werden sie jedoch von den größten multinationalen Unternehmen oder militärischen Strukturen eingesetzt. Für die meisten Organisationen sind solche Maßnahmen überflüssig und wirtschaftlich nachteilig. Das Thema Sicherheit und physische Durchdringung bleibt jedoch für alle relevant.

Es gibt drei Punkte, die berücksichtigt werden müssen : Zugangskontrolle, Vorhandensein von Videokameras und Signalsensoren entlang des Perimeters und Sicherheit von „Zellen“ mit Server-Racks. Vielleicht ist der beste Weg, um jeden von ihnen zu überprüfen, ein Ausflug zum Rechenzentrum. So können Sie unabhängig beurteilen, wie schwierig es ist, in die Maschinenräume eines Rechenzentrums zu gelangen.

Beispielsweise verfügt das Xelent-Rechenzentrum am Eingang über ein Zugangskontrollsystem. Alle Besucher und Autos werden am Checkpoint inspiziert. Außerdem muss sich jeder registrieren, der das Gebiet des Rechenzentrums betritt (einschließlich der Mitarbeiter). Zweihundert Videokameras, die die Situation im Serverraum überwachen, sind auf dem Territorium selbst „verstreut“. Der Zugang zu den Maschinenräumen ist nur in Begleitung von Mitarbeitern des Rechenzentrums möglich, die über spezielle Zugangskarten verfügen (dies können Schlüsselkarten oder biometrische Karten sein).

Bewerten Sie bei der Überprüfung des physischen Schutzes von Maschinenräumen nicht nur die Perimeter- und Serversicherheit, sondern auch den Brandschutz in der Einrichtung. Das DataSpace-Rechenzentrum verwendet beispielsweise ein Branderkennungssystem. Sensoren im gesamten Gebäude werten Luftproben aus, um Brände zu vermeiden. Das Rechenzentrum verwendet sichere Geräte, ein Gasfeuerlöschsystem, das im Notfall die Minimierung möglicher Schäden ermöglicht.

Zusammenfassend


Bei der Bewertung der Zuverlässigkeit eines Cloud-Anbieters für Rechenzentren sollten folgende Schritte ausgeführt werden:

  • Achten Sie auf die Redundanz der technischen Infrastruktur. Die Verfügbarkeit hängt davon ab. Wählen Sie das erforderliche Sicherungsschema abhängig von den Anforderungen und Aufgaben des Unternehmens.
  • Bewerten Sie das Kühl- und Klimatisierungssystem im Maschinenraum. Es ist gut, wenn das Rechenzentrum Technologien zur Reduzierung des PUE verwendet. Das Rechenzentrum gibt also mehr Strom für Computer aus als für die Kühlung von Servern, wodurch Kunden Geld sparen.
  • Innerhalb des Rechenzentrums sollte der physische Schutz der Serverräume (Sicherheit, Feuerlöschsysteme, Videoüberwachung) organisiert und strenge Verfahren für die Zulassung von Besuchern in das Gebiet vorgeschrieben werden.

Die Sicherheit und Zuverlässigkeit des Rechenzentrums wird jedoch nicht nur durch physische Sicherheitsmaßnahmen, sondern auch durch Software bestimmt: Firewalls, DDoS-Schutzmechanismen, Datenverschlüsselung usw. Wir werden diese Aspekte in unserem nächsten Artikel erörtern.



PS Noch ein paar Materialien aus dem First Corporate IaaS Blog:


PPS Neue Beiträge aus unserem Blog auf Habré:




Die Haupttätigkeit des IT-GRAD-Unternehmens ist die Bereitstellung von Cloud-Diensten:

Virtuelle Infrastruktur (IaaS) | PCI DSS Hosting | Wolke FZ-152 | Mieten Sie 1C in der Cloud


Source: https://habr.com/ru/post/de416507/


All Articles