Habr, bonjour!
Je suis ingénieur leader chez
LANIT-Integration . Je travaille ici depuis plus de 20 ans. Depuis sept ans, je m'engage dans le support technique des datacenters: j'installe et met en service des équipements.
Chaque année, la fiabilité et l'utilisabilité des centres de données sont de plus en plus exigeantes. Cependant, cela ne peut être réalisé si nous nous concentrons uniquement sur les sauvegardes du système et la qualité des éléments individuels. Le marché comprend cette idée simple, de sorte que les entreprises introduisent de plus en plus un système de surveillance unifié. En bref, il surveille l'infrastructure d'ingénierie du centre de données et aide à éviter les situations d'urgence.
Dans l'article, je parlerai des solutions de surveillance de matériel et de logiciels prêtes à l'emploi que nous et mes collègues utilisons dans les projets.
SourcePour commencer, je vais vous expliquer en quoi consiste le cœur d'un centre de données. Il est divisé en trois composantes.
- Un système de télécommunication reçoit et transmet des données entre le centre de données et ses utilisateurs, et connecte également les éléments du centre.
- L'architecture technique est constituée de serveurs d'accès, serveurs d'applications, serveurs SGBD, systèmes de stockage de données. Elle est responsable du fonctionnement des applications métier et permet aux utilisateurs d'y accéder.
- L'infrastructure d'ingénierie garantit que tous les systèmes fonctionnent correctement, c'est-à-dire qu'elle prend en charge les conditions optimales pour eux.
L'infrastructure d'ingénierie des centres de données est également divisée en deux sous-systèmes: fonctionnement et sécurité. Le premier comprend les systèmes d'alimentation générale, garantie et ininterrompue, le conditionnement technologique, les constructions de montage. Le sous-système de sécurité comprend des systèmes d'alarme incendie, des systèmes d'extinction d'incendie à gaz autonomes, la vidéosurveillance, le contrôle et la gestion des accès.
Pour être sûr que tous les systèmes fonctionnent normalement, une surveillance constante est nécessaire, ce qui donne une surveillance.
SourceLa surveillance aide les ingénieurs des centres de données à travailler plus confortablement. Sans cela, les spécialistes doivent soit vivre et travailler tout le temps près des armoires, soit quitter le bureau et courir vers eux chaque fois qu'un problème survient ou que l'on soupçonne qu'il pourrait se produire.
SourceLa surveillance en temps réel montre le fonctionnement de l'infrastructure du centre de données. Les indicateurs de performance sont généralement contrôlés par un quart de travail. Si une déviation ou une urgence se produit, le personnel de quart de travail peut prévenir une situation critique à temps ou minimiser ses conséquences. Le système de surveillance collecte également des données sur les paramètres, l'état des équipements, surveille les conditions de service, les heures travaillées, etc.
Que contrôle exactement le système de surveillance et quelles tâches résout-il?
- Surveille les paramètres du réseau d'alimentation et l'état des disjoncteurs;
- surveille l'état et les paramètres de fonctionnement des alimentations sans coupure;
- surveille l'état et les paramètres de fonctionnement des machines de réfrigération, des climatiseurs et des unités de ventilation;
- recueille des données sur la température et l'humidité, apprend la présence de fuites et de fumée dans le centre de données;
- crée des rapports et des graphiques sur les paramètres requis;
- envoie des notifications de tous les événements et urgences;
Protection contre les personnes
Malheureusement, les statistiques indiquent que de nombreuses situations d'urgence avec des équipements se produisent en raison de défaillances humaines. C'est pourquoi la surveillance, entre autres, surveille non seulement les paramètres, mais aussi ceux qui ont accès au centre de données et qui / quoi le fait.

Types de systèmes de surveillanceIl existe de nombreux systèmes différents qui vous permettent en quelque sorte de contrôler les paramètres et le fonctionnement de divers types d'équipements - surveillance des systèmes informatiques, surveillance SCS / LAN, surveillance des systèmes d'ingénierie, etc.
Par type d'implémentation, les systèmes sont divisés en solutions logicielles, matérielles et hybrides.
Selon le niveau de contrôle, les systèmes de surveillance sont divisés en distribués et centralisés.
Les systèmes distribués vous permettent de surveiller l'état d'un ou plusieurs appareils du même type.
Les systèmes centralisés permettent de combiner tous les équipements contrôlés, y compris plusieurs systèmes distribués, en un seul système qui vous permet de surveiller le fonctionnement de tous les équipements dans une "fenêtre unique".
SourceEn quoi consiste-t-il
Depuis de nombreuses années, mes collègues et moi travaillons avec le système de surveillance NetBotz et le système de gestion d'infrastructure de centre de données StruxureWare Data center Expert d'APC by Schneider Electric. Notre équipe possède la certification d'affiliation de DCIM.
La plupart des fabricants d'équipements d'ingénierie ont des solutions complètes. Avec leur aide, vous pouvez créer une infrastructure d'ingénierie de centre de données clé en main et assembler un système de surveillance «en cubes».
C’est:
- contrôleurs de surveillance - dispositifs auxquels toutes sortes de capteurs sont connectés et qui collectent des informations à partir de ces capteurs;
- extenseurs de port pour connecter des capteurs - unités supplémentaires connectées à des contrôleurs de surveillance pour augmenter le nombre de capteurs connectés;
- capteurs de température, humidité, fuite, fumée, ouverture de porte, détection de mouvement, vibration, capteurs analogiques 4-20 mA et 0-5 volts, contacts secs, etc.;
- dispositifs pour contrôler et restreindre l'accès aux armoires de communication et aux pièces;
- caméras de sécurité.
Cependant, les systèmes prêts à l'emploi présentent également des inconvénients. En règle générale, chaque fabricant propose un système de surveillance de son équipement, c'est-à-dire qu'il produit. Bien sûr, cela est très pratique lorsque l'infrastructure du centre de données est construite sur l'équipement d'une seule marque. La mise en place d'un tel système prend peu de temps, il n'y a pas de problème de connexion et de reconnaissance des paramètres d'équipement.
SourceOn pouvait s'y attendre, le principal problème de ces systèmes est la connexion d'équipements tiers. Il arrive que de tels systèmes prennent en charge certains types et modèles d'équipements tiers, mais pour la connexion correcte et l'affichage des paramètres très souvent, des étapes et du temps supplémentaires sont nécessaires.
Par exemple, pour connecter des appareils d'autres marques connectés via
MODBUS au système APC Data center Expert qui ne figurent pas sur la liste prise en charge, vous devez contacter le service d'assistance. Dans ce cas, vous devez fournir des données techniques sur l'équipement connecté, remplir plusieurs formulaires et attendre environ un mois. Il est presque impossible de le faire vous-même.
Installation et configuration
De la théorie à la pratique. Nous avons installé le premier système de surveillance en 2010. Au total, nous avons mis en œuvre plus de 15 systèmes de surveillance de centre de données. D'une part, le travail est le même à chaque fois, d'autre part, chaque client a ses propres conditions et exigences, donc chaque projet est mémorisé par quelque chose de différent. Ci-dessous, je parlerai des projets les plus intéressants de ces dernières années.
NIS GLONASS
Deux centres de données étaient situés à Moscou et à Saint-Pétersbourg. Ils étaient reliés par un seul système de surveillance des infrastructures d'ingénierie. Pour la première fois dans ce projet, les utilisateurs devaient partager les droits d'utilisateur pour accéder aux groupes d'appareils. Comment est-ce? Les spécialistes de Moscou contrôlaient tous les appareils dans les deux centres de données, tandis que les spécialistes de Saint-Pétersbourg ne contrôlaient que leur partie de l'équipement.
Projet d'une usine métallurgique
Pour la première fois, notre équipe a dû «visser» des équipements tiers, un groupe électrogène diesel, un panneau d'automatisation et un panneau de commande de climatisation au système de surveillance
StruxureWare Data center Expert . Non sans l'aide d'experts occidentaux du service d'assistance du fabricant du système de surveillance. Pendant un mois, ils ont écrit des pilotes pour les appareils dont nous avons besoin.
Unité de recherche publique
Ici, en plus de la solution standard, pour la première fois, nous avons mis en œuvre la surveillance du tableau de l'appareillage d'entrée avec des disjoncteurs automatiques, contrôlé par le relais programmable ZelioLogic, le panneau de distribution électrique avec l'état des disjoncteurs sur le contrôleur Acti-9 SmartLink et les compteurs électriques PowerLogic de Schneider Electric.
Technopark
Pour la première fois dans le pays, nous avons mis en place des systèmes de surveillance et des systèmes de gestion de l'infrastructure des centres de données utilisant 190 capteurs de température et d'humidité sans fil situés dans 6 salles des machines et 4 salles d'équipement.
Relativement bientôt, un autre grand projet va démarrer. Ce sera pour nous une nouvelle expérience. Il est nécessaire d'introduire des systèmes de surveillance RAMOS et un système de gestion des infrastructures pour les centres de données Aegis DCIM (fabricant tchèque CONTEG). Peut-être y aura-t-il encore une raison de vous dire quelque chose.
Soit dit en passant, notre équipe est toujours à la recherche de professionnels talentueux et enthousiastes.