À propos du centre de données en toute honnêteté: comment nous avons résolu le problème de la poussière dans les salles de serveurs du centre de données



Bonjour, Habr! Je suis Taras Chirkov, directeur du centre de données Linxdatacenter à Saint-Pétersbourg. Et aujourd'hui, dans notre blog, je parlerai du rôle que joue le maintien de la propreté dans une pièce dans le fonctionnement normal d'un centre de données moderne, comment le mesurer, le réaliser et le maintenir correctement au bon niveau.

Déclencheur de pureté


Une fois, un client d'un centre de données à Saint-Pétersbourg nous a approché au sujet d'une couche de poussière dans la partie inférieure du rack d'équipement. Ce fut le point de départ de l'enquête, dont les premières hypothèses suggèrent ce qui suit:

  • la poussière pénètre dans les salles des serveurs par la semelle des chaussures des employés et des clients du centre de données,
  • entrée par le système de ventilation,
  • à la fois cela et un autre.

Couvre-chaussures bleus - à la poubelle de l'histoire


Commencé avec des chaussures. A cette époque, le problème de propreté était résolu de manière traditionnelle: un conteneur avec des couvre-chaussures à l'entrée. L'efficacité de l'approche n'a pas atteint le niveau souhaité: il était difficile pour les clients de contrôler leur utilisation par les clients du centre de données, et le format lui-même n'était pas pratique. Ils ont rapidement abandonné au profit de technologies plus avancées sous la forme d'une voiture à chaussures. Le premier modèle que nous avons installé pour un tel appareil a échoué: la machine déchirait trop souvent les couvre-chaussures en essayant de les mettre sur des chaussures, son utilisation était plus ennuyeuse que de faciliter la vie.

S'agissant de l'expérience de collègues de Varsovie et de Moscou, le problème n'a pas été résolu et, en conséquence, le choix a été fait en faveur de la technologie de fusion du film thermique sur les chaussures. Avec l'aide d'un film thermique, vous pouvez mettre des «couvre-chaussures» sur des chaussures avec n'importe quelle semelle - jusqu'à un talon fin féminin. Oui, le film glisse parfois aussi, mais beaucoup moins souvent que les couvre-chaussures bleus classiques, et la technologie elle-même est beaucoup plus pratique pour le visiteur et plus moderne. Un autre avantage important (pour moi) plus - le film couvre facilement les plus grandes tailles de chaussures, contrairement aux couvre-chaussures traditionnels, déchirés lorsque vous essayez de les mettre à la 45e taille. Pour une plus grande modernité du processus, des urnes ont été installées avec une ouverture automatisée du couvercle par un capteur de mouvement.

Ce processus ressemble à ceci:


Les clients ont immédiatement apprécié l'innovation.

La poussière dans le vent


Après avoir mis en ordre le canal le plus évident de pollution possible de l'espace, nous avons repris la matière la plus fine: l'air. Il est probable qu'une partie importante de la poussière pénètre dans les salles des serveurs par la ventilation en raison d'un filtrage insuffisant, ou est amenée de la rue. Ou s'agit-il de nettoyage de mauvaise qualité? L'enquête s'est poursuivie.

Nous avons décidé de prendre des mesures de la teneur en particules dans l'air à l'intérieur du centre de données et avons invité un laboratoire spécialisé dans le contrôle de la qualité de l'air dans les salles blanches à des fins spéciales pour effectuer ces travaux.

Le personnel du laboratoire a mesuré le nombre de points de contrôle (20), compilé un programme d'échantillonnage pour suivre la dynamique et créer l'image la plus précise. Le coût de l'ensemble du processus de mesures par le laboratoire s'est élevé à environ 1 million de roubles, ce qui nous a semblé totalement inopportun, mais il a donné un certain nombre d'idées pour une mise en œuvre indépendante. En cours de route, il est devenu clair que le laboratoire est bon, mais les analyses doivent être effectuées en dynamique et accéder constamment à leurs services est extrêmement gênant.

Après avoir examiné les actions prévues du laboratoire, nous avons décidé d'examiner des dispositifs plus utilitaires pour un travail indépendant. En conséquence, nous avons réussi à trouver l'instrument nécessaire pour cette tâche - un analyseur de la qualité de l'air. En voici un:


L'appareil affiche la teneur en particules de différents diamètres (en micromètres).

Réviser les normes


Cet appareil analyse le nombre de particules, la température, l'humidité et affiche les résultats en unités de mesure, respectivement, avec les normes ISO pour ce paramètre. L'écran affiche les niveaux de particules de différents diamètres dans l'échantillon d'air.

Dans le même temps, ils ont péché sur les filtres: à cette époque, les modèles de filtres G4 étaient utilisés à l'intérieur des salles de serveurs. Ce modèle fournit une purification approximative de l'air, par conséquent, la probabilité du passage de particules conduisant à une contamination a été supposée. Nous avons décidé d'acheter des filtres fins F5 utilisés dans les systèmes de climatisation et de ventilation comme filtres de deuxième étage (post-traitement) pour les tests.

L'enquête a été effectuée - vous pouvez procéder aux mesures de contrôle. Ils ont décidé d'utiliser les exigences de la norme ISO 14644-1 pour le nombre de particules en suspension comme guide.


Classification des salles blanches par le nombre de particules en suspension.

Il semblerait - mesurer et comparer selon le tableau. Mais tout n'est pas si simple: en pratique, il s'est avéré assez difficile de trouver des normes de pureté de l'air pour les salles de serveurs du datacenter. Cela n'est indiqué explicitement nulle part, par aucune organisation ou institut industriel. Et ce n'est que sur le forum interne Uptime Inside Track (l'accès à celui-ci a des personnes qui ont été formées dans le cadre des programmes de l'Uptime Institute) qu'il y a eu une discussion séparée sur ce sujet. Sur la base des résultats de son étude, ils étaient enclins à se concentrer sur la norme ISO 8 - l'avant-dernière de la classification.

Les toutes premières mesures ont montré que nous nous sous-estimions - les résultats des inspections internes de l'air ont permis de respecter les exigences de la norme ISO 5 dans les locaux intérieurs, ce qui a largement dépassé les normes requises par les participants d'Uptime Inside Track. Dans le même temps - avec une grande marge. Nous avons un centre de données, et pas un laboratoire de biologie, bien sûr, mais pour que la concentration de particules dans l'air soit égale à ISO 8, cela devrait être un objet de la classe «cimenterie minimale». Et comment appliquer la même norme à un centre de données n'est pas très clair. Dans le même temps, nous avons obtenu le résultat à ISO 5, en effectuant des mesures lors du filtrage de l'air avec des filtres G4. Autrement dit, la poussière ne peut pas pénétrer dans les racks par l'air, les filtres F5 se sont révélés excessifs et ils n'ont même pas été utilisés.

Un résultat négatif est également un résultat: nous avons continué à rechercher les causes de la pollution dans d'autres directions, et avons inclus le contrôle de la qualité de l'air dans les inspections trimestrielles, en les combinant avec des inspections des capteurs BMS par des appareils vérifiés (exigences ISO 9000 et audits clients).

Vous trouverez ci-dessous un exemple de rapport qui est rempli sur la base des données obtenues lors de la mesure. Pour une plus grande précision, les mesures sont effectuées par deux instruments - Testo 610 et capteur BMS. L'en-tête du tableau indique les valeurs limites des appareils. La déviation de ces paramètres est automatiquement mise en évidence pour faciliter l'identification des zones à problème ou des périodes.

Tout est clair chez nous: la différence de performance de l'instrument est minime et la concentration en particules est bien inférieure à la limite.

Par la porte arrière


Comme il y avait d'autres entrées dans les salles blanches en plus de l'entrée principale pour les clients, où nous avons installé une machine à chaussures, il restait la nécessité d'empêcher la saleté d'entrer dans le centre de données par leur intermédiaire.

Il n'est pas pratique de porter / retirer les couvre-chaussures pendant les procédures de déchargement de l'équipement, nous avons donc trouvé une machine pour nettoyer les semelles. Idéalement, fonctionnellement, mais le facteur humain affecte sous la forme d'une approche facultative de cet appareil. En fait, comme pour les couvre-chaussures à l'entrée principale.



Pour résoudre le problème, ils ont commencé à rechercher des options de nettoyage qui ne peuvent être évitées: les tapis collants avec des couches séparables ont géré ce mieux. Dans le processus d'autorisation à la porte d'entrée, le visiteur doit se tenir sur un tel tapis, enlever l'excès de poussière de la semelle de ses chaussures.


Les femmes de ménage déchirent la couche supérieure d'un tel tapis tous les jours, il y a 60 couches - assez pour environ 2 mois.

Après avoir visité le centre de données d'Ericsson à Stockholm, entre autres, j'ai attiré l'attention sur la façon dont ces problèmes y sont résolus: avec les couches détachables, la Suède utilise des tapis antibactériens Dycem réutilisables. J'ai aimé l'idée en raison du principe de réutilisabilité et de la possibilité de fournir une grande zone de couverture.


Tapis antibactérien magique. C'est dommage, pas un avion, mais ça pourrait - à un tel prix!

Nous avons à peine trouvé des représentants d'entreprises en Russie et estimé le coût de la solution pour notre centre de données. En conséquence, nous avons obtenu un chiffre presque 100 fois plus cher que les solutions avec des tapis multicouches - environ le même 1 million de roubles que dans le projet avec des mesures de pureté de l'air. De plus, il est devenu clair qu'il fallait utiliser des produits de nettoyage spéciaux, naturellement disponibles uniquement chez ce fabricant. La solution est également tombée d'elle-même, s'est installée sur une version multicouche.

Travail manuel


Je voudrais surtout attirer l'attention sur le fait que toutes ces mesures n'ont pas annulé l'utilisation du travail des nettoyeurs. Pour préparer la certification du centre de données Linxdatacenter selon la norme Uptime Institute Management & Operations, il était nécessaire de réglementer clairement les actions des employés du service de nettoyage dans le centre de données. Des instructions détaillées ont été rédigées, précisant où, quoi et comment elles devaient être faites.

Quelques extraits des instructions:





Comme vous pouvez le voir, tout est enregistré, littéralement tous les aspects du travail dans une pièce particulière, les agents de nettoyage, les matériaux, etc. qui sont acceptables. Pas un seul détail n'est laissé sans attention, même le plus petit. Briefing - sous la signature de chaque employé du service. Dans les salles de serveurs, les salles électriques, etc. ils ne sont nettoyés qu'en présence d'employés autorisés du centre de données, par exemple un ingénieur de garde.

Mais ce n'est pas tout


Également dans la liste des mesures pour garantir la propreté dans le centre de données: tournées avec une inspection visuelle des locaux, y compris des inspections hebdomadaires des racks pour détecter les restes de fils laissés à l'intérieur, emballer les résidus de l'équipement et des composants. Pour chacun de ces épisodes, un incident est déclenché, le client reçoit une notification sur la nécessité d'éliminer les violations dès que possible.

De plus, pour le déballage et l'installation de l'équipement, nous avons créé une salle séparée - cela fait également partie de la politique de nettoyage de l'entreprise.

Une autre mesure que nous avons apprise de la pratique d'Ericsson est de maintenir une alimentation en air constante dans les salles des serveurs: il y a plus de pression à l'intérieur des salles qu'à l'extérieur afin qu'il n'y ait pas de traction à l'intérieur - cette solution sera décrite plus en détail dans un article séparé.

Enfin, nous nous sommes procuré les robots assistants pour les chambres, qui sont exclus de la liste du personnel de nettoyage disponible pour la visite.


La grille sur le dessus donne non seulement une protection +10 au robot, mais lui permet également de ne pas se coincer sous les chemins de câbles verticaux des racks.

Une découverte inattendue comme conclusion


La propreté dans le centre de données est importante pour le fonctionnement du serveur et de l'équipement réseau qui aspire l'air à travers lui-même. Le dépassement des niveaux de poussière autorisés entraînera l'accumulation de poussière sur les composants et l'augmentation de la température totale jusqu'à 1 degré Celsius. La poussière réduit l'efficacité du refroidissement qui, en termes d'année, peut se transformer en coûts indirects perceptibles et affecter la tolérance aux pannes de l'installation dans son ensemble.

Nous pouvons dire qu'il s'agit d'une hypothèse spéculative, mais les experts de l'Uptime Institute, qui ont certifié le centre de données Linxdatacenter conformément au Management & Operations Quality Standard, accordent une grande attention à la propreté. Et ce fut d'autant plus agréable de recevoir les évaluations les plus flatteuses dans ce domaine: notre centre de données de Saint-Pétersbourg dépasse largement les exigences de certification. L'expert de l'institut nous a appelés «le centre de données le plus propre qu'il ait vu». De plus, notre centre de données est utilisé par Uptime comme exemple pour résoudre le problème des salles de serveurs propres. De plus, nous réussissons facilement tout audit client sur ce paramètre - les exigences les plus sérieuses des clients les plus capricieux sont satisfaites avec excès.

Revenons au début de l'histoire. D'où vient la pollution dans la plainte même du début de l'article? La partie du bureau du client qui a provoqué le lancement de l’ensemble du projet «Clean Data Center» a été contaminée dès son importation et son installation dans le centre de données. Le client n'avait pas nettoyé le rack au moment de son entrée dans la salle des serveurs - lors de la vérification des racks voisins installés en même temps, il s'est avéré que la situation était la même avec la poussière. Cette situation a été la raison de l'ajout d'un point de contrôle de nettoyage à la liste de contrôle client pour l'installation du rack. La probabilité de telles choses ne doit pas non plus être oubliée = prévenue, donc armée. Il s'agit de «pureté et dictature» dans notre centre de données, dans le prochain article je parlerai des capteurs de pression, mais pour l'instant posez des questions dans les commentaires.

Source: https://habr.com/ru/post/fr445766/


All Articles