Die Auswahl eines Rechenzentrums für Ihr Projekt ist immer noch ein Problem. Das beste Rechenzentrum für Ihre Aufgaben zu finden ist einfacher, wenn Sie wissen, worauf Sie bei der Suche achten müssen. Bei der Playkey-Cloud-Gaming-Plattform hängt die Streaming-Qualität direkt vom Rechenzentrum ab: Zuverlässigkeit, Nähe zum Benutzer, Netzwerkqualität und andere Parameter. Daher arbeiten wir jeden Tag mit Rechenzentren zusammen und kennen deren Hauptprobleme.

In dieser Veröffentlichung erklärt Ihnen der CTO von Playkey, Alexey Lykov, wie Sie ein Rechenzentrum auswählen, worauf Sie bei der Suche achten sollten, warum Sie sich mit den Funktionen von Netzteilen befassen und wie sich europäische Rechenzentren von russischen unterscheiden. Wir geben das Wort an Alexei weiter.
1. Lernen Sie den Tier Data Center Standard kennen
Die erste Frage bei der Auswahl eines Rechenzentrums ist Zuverlässigkeit oder Verfügbarkeit. Die beliebteste Zertifizierung für diesen Parameter ist die Uptime Institute-Methode, mit der alle Rechenzentren in vier Ränge (Tier) unterteilt werden. Es gibt ein alternatives System zur Bewertung der Zuverlässigkeit von Rechenzentren gemäß dem TIA 942-Standard, das jedoch für uns aufgrund seiner Empfehlung nicht so interessant ist. Im Fall des Uptime Institute-Zertifikats überprüfen sie selbst die DCs in mehreren Phasen (von der Erstellung der Baudokumentation bis zur regelmäßigen Bewertung der Betriebsleistungen des Zentrums) und geben eine Bewertung auf der Grundlage der Ergebnisse des Audits ab. Es ist fast unmöglich, ein solches "gefälschtes" Zertifikat für einen DC zu erhalten.
Hier ist eine kurze Beschreibung jeder der vier Stufen:
- Tier 1 . Technische Infrastruktur ohne Redundanz und redundante Ressourcen. Die Ausfallzeit pro Jahr beträgt 28,8 Stunden. Die Fehlertoleranzquote beträgt 99,671%.
- Tier 2 . Das System verfügt nicht über vollständige Redundanz, ist jedoch mit zusätzlichen Kühl- und Stromversorgungselementen ausgestattet. Ausfallzeit pro Jahr - 22,0 Stunden. Ausfallsicherheitsquote - 99,749%.
- Tier 3 . Das Rechenzentrum verfügt über mehrere Kanäle für die Stromverteilung und -kühlung sowie über redundante Komponenten. Die Ausfallzeit pro Jahr beträgt 1,6 Stunden. Die Fehlertoleranzquote beträgt 99,982%.
- Tier 4 . Rechenzentren mit doppelter Redundanz unter Berücksichtigung mindestens einer zusätzlichen Komponente. Mehrere aktive Arten der Lastverteilung und Kühlung mit redundanten Komponenten 2 (N + 1), d.h. 2 USVs mit jeweils Redundanz N + 1. Die Ausfallzeit des Rechenzentrums auf TIER IV-Ebene für ein Jahr beträgt höchstens 24 Minuten, und die Failover-Quote beträgt 99,995%.
Eine Karte aller zertifizierten Rechenzentren des Uptime Institute befindet sich hier , jedoch deren Standort in Russland. Nur 26 Stücke, und alle sind ausschließlich im europäischen Teil des Landes:

Blau auf der Karte markiert das einzige russische Rechenzentrum, das nach dem maximalen TIER IV-Standard zertifiziert ist. Es befindet sich nicht in Moskau, sondern in Saransk. So sieht es von innen aus:

Das Foto zeigt deutlich den abnehmbaren Doppelboden, der ungefähr so angeordnet ist:

In Übereinstimmung mit der Klassifizierung des Verfügbarkeitsniveaus des Rechenzentrums durch das Uptime Institute sieht TIER IV eine vollständige Reservierung aller technischen Systeme mit einem Koeffizienten von 2N + 1 vor, die Reparaturarbeiten ohne Unterbrechung der Rechenzentrumsdienste ermöglicht.
So sieht ein Stromversorgungssystem mit unabhängigen Stromeingängen für das Rechenzentrum in Saransk aus:

Nach offiziellen Angaben soll das Rechenzentrum in Mordowien die zentrale Einheit für die E-Government-Infrastruktur werden, aber auch die Aufgaben von Banken, Versicherungsunternehmen und sogar des Militärs erfüllen.
Die Anforderungen verschiedener Stufen scheinen manchmal etwas verwirrt zu sein (zum Beispiel die Notwendigkeit, einen separaten Parkplatz für Mitarbeiter und Gäste von DC zu haben), aber zum größten Teil sind sie angemessen. Daher müssen DCs gemäß dem Tier 3-Standard Eigentümer der Räumlichkeiten sein. Es ist klar, dass der Eigentümer des Gebäudes, wenn das Rechenzentrum an einem gemieteten Ort errichtet wird, jederzeit alles einfallen kann und entweder die Preise erhöht oder den Vertrag insgesamt bricht, unabhängig von den Strafen. Wenn Sie eine Site mit einem Tier 3-Zertifikat oder höher sehen, ist dieses Risiko ausgeschlossen. Wir haben uns für ein Rechenzentrum entschieden, das nicht unter Tier 2 liegt, und unser europäisches Rechenzentrum in Deutschland ist nach Tier 3 zertifiziert.
Es gab einen merkwürdigen Fall, als der DC ein Zimmer in einem hohen Stockwerk mietete und der Aufzug anderen Personen gehörte. Dementsprechend war er für das Wochenende und die Nacht ausgeschaltet, und es war problematisch, die Ausrüstung zu starten.
2. Geben Sie die Parameter für die Stromversorgung und Kühlung des Rechenzentrums an
Wenn Sie eine nicht standardmäßige Serverkonfiguration verwenden, kann das zweite Element sicher mit dem ersten gleichgesetzt werden. Wir achten immer besonders auf die Stromversorgung und Kühlung von Servern, da wir keine gewöhnlichen, sondern GPU-Server verwenden, für die die meisten Rechenzentren nicht ausgelegt sind.
Wenn wir das Standard-Server-Rack mit 42 Einheiten verwenden, sieht es normalerweise so aus (Laptop nicht im Lieferumfang enthalten):

Normalerweise bringen Besitzer von Rechenzentren 7 bis 10 Kilowatt Leistung in ein solches Rack und legen die entsprechende Kühlung an. Dies ist ausreichend für ein Design mit typischen Servern, die etwa 300-500 Watt verbrauchen, einschließlich verschiedene Speichersysteme, Schaltgeräte, Patchfelder und so weiter. In unserem Fall "frisst" jedoch nur die Grafikkarte im GPU-Server 150 bis 250 Watt, und bis zu 8 dieser Grafikkarten werden auf einem Gerät verwendet. Infolgedessen beträgt der Gesamtverbrauch des GPU-Servers etwa 2 Kilowatt.
Aus diesem Grund können wir nur 3-4 Server in ein Rack stellen, d. H. 6-8 Einheiten, wenn es sich um Server mit 2 Einheiten handelt. Infolgedessen können wir im Server-Rack nur 8 Einheiten belegen, und 34 Einheiten sind kostenlos. Dies wirft die Frage nach der Raumeffizienz auf. Und uns Mietpreise erhöhen.
Die Schlussfolgerung? Wenn Sie ungewöhnliche Anfragen nach Geräten haben, lohnt es sich, nach einem Rechenzentrum zu suchen, das für Kunden wie Sie (zumindest teilweise) geschärft ist. In unserem Fall für Clients mit GPU-Servern mit einer großen Stromversorgung der Racks und einer verbesserten Kühlung. Bisher gibt es jedoch nur sehr wenige solcher Clients (und Rechenzentren).
3. Wählen Sie einen Standort anhand des Standorts Ihrer Benutzer
Es klingt kitschig, aber es ist erwähnenswert, dass der Standort Ihrer Forschungs- und Entwicklungsabteilung oder Ihres Hauptsitzes kein Ort für Ihr Rechenzentrum sein muss. In erster Linie - wo sich der Großteil der Dienstnutzer befindet. Bei Playkey befindet sich das Entwicklungsbüro in Perm. Zu Beginn haben wir auch mit dem lokalen Perm-Rechenzentrum zusammengearbeitet, wodurch die Einrichtung vereinfacht und Probleme mit dem Rechenzentrum schnell behoben werden konnten. Aber als die Benutzerbasis schnell zu wachsen begann und der Hauptteil (derjenigen, die in Russland spielen) noch aus Moskau stammte, beschlossen wir, auch alle Server im Zentrum zu gruppieren.
Nach dem Umzug der Hauptstadt in das Moskauer Rechenzentrum konnten wir sofort eine Verbesserung der Kommunikationsqualität und ein positives Feedback der Spieler feststellen.
4. Suchen Sie nach Managementkontakten und testen Sie den technischen Support im Voraus
Schneller technischer Support und eine angemessene Verwaltung sind ein weiterer wichtiger Punkt in der Arbeit des Rechenzentrums. Versuchen Sie, eine typische Aufgabe mit den Mitarbeitern des Rechenzentrums zu klären. Konfigurieren Sie sie beispielsweise gemäß den BIOS-Anweisungen und sehen Sie sich die Reaktion an. Wenn Sie zu einem anderen Spezialisten geschickt werden oder mit einer Antwort langsamer werden, sind all dies nicht die besten Anzeichen. Denken Sie daran, dass das Problem ohne physische Präsenz meistens nicht behoben wird, wenn dem Server etwas Ernstes passiert. Und technischer Support - Ihre "Hände" bei ernsthaften Problemen.
Denken Sie bei der Verwaltung des Rechenzentrums daran, dass die Koordination ohne den Kontakt des „Entscheidungsträgers“ lange Tage und Wochen dauern wird. Wenn Sie sich bis zur Vertragsunterzeichnung erst mit der letzten Person treffen, die tatsächlich Entscheidungen im Rechenzentrum trifft, ist es besser, nach einer alternativen Plattform für das Hosting von Servern zu suchen.

5. Überprüfen Sie die juristische Person des Eigentümers des Rechenzentrums
Der kürzeste, aber nicht weniger wichtige Punkt. Seien Sie nicht zu faul, um die juristische Person auf nalog.ru zu "durchbrechen". Schauen Sie sich den Auszug aus dem Register an - und Sie werden verstehen, wie lange das Unternehmen existiert, wie oft sich Management und Eigentümer geändert haben. Und vergessen Sie nicht, in der Datenbank der Schiedsverfahren ihre Gerichtsverfahren zu sehen.
6. Wenn Sie mit einem europäischen DC arbeiten, haben Sie bitte etwas Geduld
Die Mentalität europäischer Rechenzentren und ihre Arbeitsorganisation unterscheiden sich erheblich von Russland. Aufgrund unserer Erfahrung mit europäischen Rechenzentren können wir mit Sicherheit sagen, dass sie alles langsamer machen. Wenn in Russland Mitarbeiter des technischen Supports fast jedes Problem mit den Servereinstellungen schnell lösen können, ist dies in Europa nicht so einfach. Sie haben immer eine interne Aufteilung der Mitarbeiter in diejenigen, die an Aufgaben auf niedriger und hoher Ebene beteiligt sind. Die bürokratische Maschine zwingt die Kunden zu beweisen, dass das Problem wirklich wichtig ist, und erfordert das sofortige Eingreifen eines "hochrangigen" Spezialisten aus dem Rechenzentrum. Machen Sie sich bereit, den Grund für Ihre Berufung detailliert zu beschreiben, warten Sie auf die Genehmigung "mit den Spitzen" und hoffen Sie erst dann auf Hilfe.
Es gibt Unterschiede in der Arbeitsweise. In Russland können beispielsweise fast alle Anfragen an das Rechenzentrum per Chat oder Brief gesendet werden und erhalten umgehend eine Antwort. Wenn wir mit Mitarbeitern von Rechenzentren in Deutschland und Großbritannien zusammenarbeiten, müssen wir nur telefonisch kommunizieren. Warum? Es ist nur so, dass es für sie so üblich ist.
Solche Nuancen machen die Europäer noch langsamer. Es lohnt sich, einen Rabatt auf die Tatsache zu gewähren, dass wir selbst aus Russland stammen und es für uns einfacher ist, mit der russischsprachigen Unterstützung zu interagieren, aber auch ohne Rücksicht darauf sind die Prozesse von "uns" meiner Meinung nach besser organisiert und die Arbeit ist schneller.
Wir haben jetzt mit den Vorbereitungen für den Eintritt in den US-Markt begonnen, daher sind für uns alle beschriebenen Punkte alles andere als leer. Mit den Staaten werden wir nicht drei Stunden vom Rechenzentrum entfernt sein, und es wird einen anständigen Unterschied in den Zeitzonen geben. Wir werden uns also der Wahl eines langfristigen Partners mit aller Verantwortung nähern. Ein Plus für einen schnellen Start wird ein Cloud-Anbieter sein, da im vergangenen Jahr bereits zwei große Dienste die Möglichkeit eingeführt haben, Server mit einer GPU zu mieten.
Und für diejenigen, die die Qualität unserer Rechenzentren überprüfen möchten, haben wir den nächsten Aktionscode PlaykeyGeekSummer für 720 Minuten des Spiels vorbereitet. Es funktioniert ab dem Zeitpunkt der Aktivierung vier Tage lang, ist nur für neue Benutzer geeignet und darf erst am 31. Juli 2017 aktiviert werden.