Six règles pour choisir un centre de données

Le choix d'un centre de données pour votre projet est toujours difficile. Il est plus facile de trouver le meilleur centre de données pour vos tâches si vous savez quoi rechercher lors de la recherche. Dans le cas de la plate-forme de jeu en nuage Playkey, la qualité du streaming dépend directement du centre de données: sa fiabilité, sa proximité avec l'utilisateur, la qualité du réseau et d'autres paramètres. Par conséquent, nous travaillons quotidiennement avec des centres de données et nous connaissons leurs principaux problèmes.




Dans cette publication, Playkey CTO Alexey Lykov vous expliquera comment choisir un centre de données, ce qu'il faut retenir lors de la recherche, pourquoi se plonger dans les caractéristiques des alimentations et en quoi les centres de données européens diffèrent des centres russes. Nous passons la parole à Alexei.


1. Apprenez la norme Tier Data Center


La première question lors du choix d'un centre de données est la fiabilité ou la disponibilité. La certification la plus populaire pour ce paramètre est la méthodologie Uptime Institute, qui divise tous les centres de données en quatre rangs (niveau). Il existe un autre système pour évaluer la fiabilité des centres de données selon la norme TIA 942, mais il n'est pas si intéressant pour nous en raison de sa nature recommandatoire. Dans le cas du certificat Uptime Institute, ils vérifient eux-mêmes les CD à plusieurs étapes (de la conception de la documentation de construction à une évaluation régulière des services opérationnels du centre) et émettent une évaluation sur la base des résultats de l'audit. L'obtention d'un tel "faux" certificat pour un DC est presque impossible.


Voici une brève description de chacun des quatre niveaux:


  • Niveau 1 . Infrastructure d'ingénierie sans redondance et ressources redondantes. Le temps d'arrêt par an est de 28,8 heures. Le taux de tolérance aux pannes est de 99,671%.
  • Niveau 2 . Le système n'a pas de redondance complète, mais est équipé d'éléments de refroidissement et d'alimentation supplémentaires. Temps d'arrêt par an - 22,0 heures. Ratio de résilience - 99,749%.
  • Niveau 3 . Le centre de données dispose de plusieurs canaux de distribution et de refroidissement, ainsi que de composants redondants. Le temps d'arrêt par an est de 1,6 heure. Le taux de tolérance aux pannes est de 99,982%.
  • Niveau 4 . Centres de données à double redondance, prenant en compte au moins un composant supplémentaire. Plusieurs modes actifs de répartition de la charge et de refroidissement avec des composants redondants 2 (N + 1), c'est-à-dire 2 onduleurs avec redondance N + 1 chacun. Le temps d'arrêt d'un centre de données de niveau TIER IV pendant un an ne dépasse pas 24 minutes et le taux de basculement est de 99,995%.

Une carte de tous les centres de données certifiés Uptime Institute est ici , mais leur emplacement en Russie. Seulement 26 pièces, et toutes sont exclusivement dans la partie européenne du pays:




Le bleu sur la carte représente le seul centre de données russe certifié selon la norme maximale TIER IV, et il n'est pas situé à Moscou, mais à Saransk. Voici à quoi cela ressemble de l'intérieur:




La photo montre clairement le plancher surélevé amovible, qui est disposé approximativement comme ceci:




Conformément à la classification du niveau de disponibilité du centre de données par Uptime Institute, le TIER IV prévoit la réservation complète de tous les systèmes d'ingénierie avec un coefficient de 2N + 1, ce qui permet tout travail de réparation sans suspension des services du centre de données.


Voici à quoi ressemble un système d'alimentation avec entrées électriques indépendantes pour le centre de données de Saransk:



Selon les données officielles , le centre de données de Mordovie devrait devenir l'unité centrale de l'infrastructure du gouvernement électronique, mais il devra également faire face aux tâches des banques, des compagnies d'assurance et même des militaires.


Les exigences des différents niveaux semblent parfois un peu confuses (par exemple, la nécessité d'avoir un parking séparé pour les employés et les invités de DC), mais pour la plupart, elles sont adéquates. Ainsi, les DC selon la norme Tier 3 doivent être propriétaires des locaux. Il est clair que si le centre de données est construit dans un emplacement loué, le propriétaire de l'immeuble peut proposer quoi que ce soit à tout moment, et il augmentera les prix ou rompra le contrat, quelles que soient les sanctions. Si vous voyez un site avec un certificat de niveau 3 ou supérieur, ce risque est exclu. Pour nous, nous avons choisi de travailler avec un centre de données non inférieur au niveau 2, et notre centre de données européen en Allemagne est certifié selon le niveau 3.


Il y a eu un cas curieux où le DC a loué une chambre à un étage élevé, et l'ascenseur appartenait à d'autres personnes et, en conséquence, il a été arrêté pour le week-end et la nuit, et il a été difficile de démarrer l'équipement.


2. Spécifiez les paramètres d'alimentation et de refroidissement du centre de données


Si vous utilisez une configuration de serveur non standard, le deuxième élément peut être placé en toute sécurité sur un pied d'égalité avec le premier. Nous sommes toujours particulièrement attentifs à l'alimentation et au refroidissement des serveurs, car nous n'utilisons pas des serveurs ordinaires, mais des serveurs GPU, pour lesquels la plupart des centres de données ne sont pas conçus.


Si nous prenons le rack de serveur standard à 42 unités, il ressemblera normalement à ceci (ordinateur portable non inclus):



Habituellement, les propriétaires de centres de données apportent 7 à 10 kilowatts d'énergie à un tel rack et assurent le refroidissement approprié. Cela suffit pour une conception avec des serveurs typiques qui consomment environ 300 à 500 watts, y compris divers systèmes de stockage, équipements de commutation, panneaux de brassage, etc. Mais dans notre cas, seule la carte vidéo du serveur GPU "mange" de 150 à 250 watts, et jusqu'à 8 de ces cartes vidéo sont utilisées sur un seul appareil. En conséquence, la consommation totale du serveur GPU est d'environ 2 kilowatts.


Pour cette raison, nous ne pouvons mettre que 3-4 serveurs dans un rack, c'est-à-dire 6-8 unités, si nous parlons de 2 serveurs d'unité. En conséquence, dans le rack de serveurs, nous ne pouvons occuper que 8 unités, et 34 unités seront gratuites. Cela pose la question de l'efficacité de l'espace. Et nous augmentant les prix de location.


La conclusion? Si vous avez des demandes inhabituelles d'équipement, alors il vaut la peine de chercher un centre de données affûté (au moins partiellement) pour des clients comme vous. Dans notre cas, pour les clients avec serveurs GPU, avec une grande alimentation électrique des racks et un refroidissement amélioré. Jusqu'à présent, cependant, il y a très peu de ces clients (et centres de données).


3. Choisissez un emplacement en fonction de l'emplacement de vos utilisateurs


Cela peut sembler ringard, mais il convient de rappeler que l'emplacement de votre R&D ou siège social ne doit pas nécessairement être un lieu pour votre centre de données. Principalement - où se trouve la majeure partie des utilisateurs du service. Chez Playkey, le bureau de développement est situé à Perm, et au début, nous avons également travaillé avec le centre de données local de Perm, ce qui a simplifié la configuration et a permis de résoudre rapidement tout problème avec le centre de données. Mais lorsque la base d'utilisateurs a commencé à croître rapidement, et que la majeure partie (de ceux qui jouent en Russie) venait toujours de Moscou, nous avons décidé de regrouper également tous les serveurs du centre.


Après le déménagement de la capitale vers le centre de données de Moscou, nous avons immédiatement constaté une amélioration de la qualité de la communication et un retour positif des acteurs.


4. Recherchez les contacts de gestion et «testez» le support technique à l'avance


Un support technique rapide et une gestion adéquate sont un autre point critique dans le travail du centre de données. Essayez de clarifier une tâche typique avec les employés du centre de données, par exemple, configurez selon les instructions du BIOS et examinez la réaction. Si vous êtes envoyé chez un autre spécialiste ou commencez à ralentir avec une réponse - ce ne sont pas les meilleurs signes. N'oubliez pas que si quelque chose de grave arrive au serveur, alors sans présence physique, le problème n'est généralement pas résolu. Et le support technique - vos «mains» en cas de problèmes graves.


Quant à la gestion du datacenter, n'oubliez pas que sans le contact du «décideur», toute coordination prendra de longs jours et semaines. Si, jusqu'à la signature du contrat, vous ne rencontrez pas la dernière personne qui prend réellement des décisions dans le centre de données, il est préférable de rechercher une plate-forme alternative pour l'hébergement des serveurs.



5. Vérifiez l'entité juridique du propriétaire du centre de données


Le point le plus court, mais non moins important. Ne soyez pas trop paresseux pour "percer" l'entité juridique sur nalog.ru. Regardez l'extrait du registre - et vous comprendrez depuis combien de temps l'entreprise existe, combien de fois la direction et les propriétaires ont changé. Et dans la base de données des affaires d'arbitrage, n'oubliez pas de voir ses affaires judiciaires.


6. Si vous travaillez avec un DC européen - soyez patient


La mentalité des centres de données européens et leur organisation du travail sont très différentes de la Russie. D'après notre expérience de travail avec les centres de données européens, nous pouvons affirmer avec certitude qu'ils font tout plus lentement. Si en Russie, le personnel du support technique peut résoudre rapidement presque tous les problèmes avec les paramètres du serveur, alors en Europe, ce n'est pas si simple. Ils ont toujours une division interne des employés en ceux impliqués dans des tâches de bas niveau et de haut niveau. La machine bureaucratique oblige les clients à prouver que le problème est vraiment important et nécessite l'intervention immédiate d'un spécialiste "de haut niveau" du centre de données. Préparez-vous à décrire en détail la raison de votre appel, attendez l'approbation "avec les hauts" et alors seulement espérez de l'aide.


Il existe des différences dans l'approche du travail. Par exemple, en Russie, presque toutes les demandes au centre de données peuvent être envoyées par chat ou par lettre et recevoir rapidement une réponse. Lorsque nous travaillons avec des employés de centres de données en Allemagne et au Royaume-Uni, nous sommes obligés de communiquer uniquement par téléphone. Pourquoi? C'est juste que c'est tellement habituel pour eux.


Ces nuances rendent les Européens encore plus lents. Cela vaut la peine de faire une réduction sur le fait que nous sommes nous-mêmes de Russie et il est plus facile pour nous d'interagir avec le soutien russophone, mais même sans égard à cela, les processus de "la nôtre", à mon avis, sont mieux organisés et le travail est plus rapide.


Nous avons maintenant commencé les préparatifs pour entrer sur le marché américain, donc pour nous tous les points décrits sont loin d'être des phrases vides. Avec les États, nous ne serons pas situés à trois heures du centre de données, et il y aura une différence décente dans les fuseaux horaires. Nous aborderons donc le choix d'un partenaire de long terme en toute responsabilité. Un avantage pour un lancement rapide sera un fournisseur de cloud, car au cours de la dernière année, deux grands services ont déjà lancé la possibilité de louer des serveurs avec un GPU.


Et pour ceux qui veulent vérifier la qualité de nos centres de données, nous avons préparé le prochain code promotionnel PlaykeyGeekSummer pour 720 minutes de jeu. Il fonctionne pendant quatre jours à partir du moment de l'activation, il ne convient qu'aux nouveaux utilisateurs, et n'oubliez pas de l'activer jusqu'au 31 juillet 2017.

Source: https://habr.com/ru/post/fr404939/


All Articles