Habr, hallo!
Ich bin ein führender Ingenieur bei
LANIT-Integration . Ich arbeite hier seit mehr als 20 Jahren. In den letzten sieben Jahren habe ich mich mit der technischen Unterstützung von Rechenzentren befasst: Ich installiere und starte Geräte.
Jedes Jahr werden immer mehr Anforderungen an die Zuverlässigkeit und Benutzerfreundlichkeit von Rechenzentren gestellt. Dies kann jedoch nicht erreicht werden, wenn wir uns nur auf Systemsicherungen und die Qualität einzelner Elemente konzentrieren. Der Markt versteht diese einfache Idee, weshalb Unternehmen zunehmend ein einheitliches Überwachungssystem einführen. Kurz gesagt, es überwacht die technische Infrastruktur des Rechenzentrums und hilft, Notsituationen zu vermeiden.
In dem Artikel werde ich über vorgefertigte Hardware- und Softwareüberwachungslösungen sprechen, die wir und meine Kollegen in Projekten verwenden.
QuelleZunächst werde ich darüber sprechen, woraus der Kern eines Rechenzentrums besteht. Es ist in drei Komponenten unterteilt.
- Ein Telekommunikationssystem empfängt und überträgt Daten zwischen dem Rechenzentrum und seinen Benutzern und verbindet auch die Elemente des Zentrums.
- Die technische Architektur besteht aus Zugriffsservern, Anwendungsservern, DBMS-Servern und Datenspeichersystemen. Sie ist für das Funktionieren von Geschäftsanwendungen verantwortlich und ermöglicht Benutzern den Zugriff darauf.
- Die technische Infrastruktur stellt sicher, dass alle Systeme ordnungsgemäß funktionieren, dh, sie unterstützt optimale Bedingungen für sie.
Die technische Infrastruktur von Rechenzentren ist ebenfalls in zwei Teilsysteme unterteilt: Funktion und Sicherheit. Die erste umfasst Systeme für allgemeine, garantierte und unterbrechungsfreie Stromversorgung, technologische Konditionierung und Montagekonstruktionen. Das Sicherheitssubsystem umfasst Brandmeldesysteme, autonome Gasfeuerlöschsysteme, Videoüberwachung, Zugangskontrolle und -verwaltung.
Um sicherzustellen, dass alle Systeme normal funktionieren, ist eine ständige Überwachung erforderlich, die eine Überwachung ermöglicht.
QuelleDie Überwachung hilft Rechenzentrumsingenieuren, komfortabler zu arbeiten. Ohne sie müssen Spezialisten entweder die ganze Zeit in der Nähe der Schränke leben und arbeiten oder das Büro verlassen und jedes Mal zu ihnen laufen, wenn ein Problem auftritt oder der Verdacht besteht, dass es auftreten könnte.
QuelleDie Echtzeitüberwachung zeigt, wie die Rechenzentrumsinfrastruktur funktioniert. Leistungsindikatoren werden normalerweise durch eine Schicht im Dienst überwacht. Wenn eine Abweichung oder ein Notfall auftritt, kann das Schichtpersonal eine kritische Situation rechtzeitig verhindern oder deren Folgen minimieren. Das Überwachungssystem sammelt auch Daten zu Parametern, Gerätestatus, überwacht die Nutzungsbedingungen, die geleisteten Arbeitsstunden usw.
Was genau steuert das Überwachungssystem und welche Aufgaben löst es?
- Überwacht die Parameter des Stromversorgungsnetzes und den Status von Leistungsschaltern;
- überwacht den Status und die Betriebsparameter unterbrechungsfreier Stromversorgungen;
- überwacht den Status und die Betriebsparameter von Kältemaschinen, Klimaanlagen und Lüftungsgeräten;
- sammelt Daten zu Temperatur und Luftfeuchtigkeit, informiert über das Vorhandensein von Lecks und Rauch im Rechenzentrum;
- erstellt Berichte und Grafiken zu den erforderlichen Parametern;
- sendet Benachrichtigungen über Ereignisse und Notfälle;
Schutz vor Menschen
Leider sagen Statistiken, dass viele Notsituationen mit Geräten aufgrund menschlicher Fehler auftreten. Aus diesem Grund überwacht die Überwachung unter anderem nicht nur die Parameter, sondern auch diejenigen, die Zugriff auf das Rechenzentrum haben und wer / was dies tut.

Arten von ÜberwachungssystemenEs gibt viele verschiedene Systeme, mit denen Sie die Parameter und den Betrieb verschiedener Gerätetypen steuern können - Überwachung von IT-Systemen, Überwachung von SCS / LAN, Überwachung von Engineering-Systemen usw.
Durch die Art der Implementierung werden die Systeme in Software-, Hardware- und Hybridlösungen unterteilt.
Je nach Steuerungsebene werden Überwachungssysteme in verteilte und zentralisierte Systeme unterteilt.
Mit verteilten Systemen können Sie den Status eines oder mehrerer Geräte desselben Typs überwachen.
Zentralisierte Systeme ermöglichen es, alle gesteuerten Geräte, einschließlich mehrerer verteilter Systeme, in einem einzigen System zu kombinieren, mit dem Sie den Betrieb aller Geräte in einem "einzigen Fenster" überwachen können.
QuelleWoraus besteht es?
Seit vielen Jahren arbeiten meine Kollegen und ich mit dem NetBotz-Überwachungssystem und dem Infrastrukturmanagementsystem für das StruxureWare-Rechenzentrum Expert-Rechenzentrum von APC by Schneider Electric. Unser Team verfügt über eine Affiliate-Zertifizierung für DCIM.
Die meisten Hersteller von technischen Geräten verfügen über umfassende Lösungen. Mit ihrer Hilfe können Sie eine schlüsselfertige technische Infrastruktur für Rechenzentren erstellen und ein Überwachungssystem „aus Würfeln“ zusammenstellen.
Das:
- Überwachungssteuerungen - Geräte, an die alle Arten von Sensoren angeschlossen sind und die Informationen von diesen Sensoren sammeln;
- Port-Expander zum Anschließen von Sensoren - zusätzliche Einheiten, die an Überwachungssteuerungen angeschlossen sind, um die Anzahl der angeschlossenen Sensoren zu erhöhen;
- Sensoren für Temperatur, Luftfeuchtigkeit, Leckage, Rauch, Türöffnung, Bewegungserkennung, Vibration, analoge Sensoren 4-20 mA und 0-5 Volt, trockene Kontakte usw.;
- Geräte zur Steuerung und Einschränkung des Zugangs sowohl zu Kommunikationsschränken als auch zu Räumen;
- Überwachungskameras.
Fertige Systeme haben jedoch auch Nachteile. In der Regel bietet jeder Hersteller ein Überwachungssystem für seine Geräte an, dh eines, das er herstellt. Natürlich ist es sehr praktisch, wenn die Rechenzentrumsinfrastruktur auf den Geräten einer Marke basiert. Die Implementierung eines solchen Systems nimmt wenig Zeit in Anspruch, es gibt kein Problem beim Anschließen und Erkennen von Geräteparametern.
QuelleVorhersehbar ist das Hauptproblem solcher Systeme der Anschluss von Geräten von Drittanbietern. Es kommt vor, dass solche Systeme einige Typen und Modelle von Geräten von Drittanbietern unterstützen, aber für die korrekte Verbindung und Anzeige von Parametern sind sehr oft zusätzliche Schritte und Zeit erforderlich.
Um beispielsweise Geräte anderer Marken, die über
MODBUS verbunden sind, mit dem APC Data Center Expert-System zu verbinden, die nicht in der Liste der unterstützten
Programme aufgeführt sind, müssen Sie sich an den Support-Service wenden. In diesem Fall müssen Sie technische Daten zu den angeschlossenen Geräten bereitstellen, mehrere Formulare ausfüllen und etwa einen Monat warten. Es ist fast unmöglich, dies alleine zu tun.
Installation und Einrichtung
Von der Theorie zur Praxis. Wir haben das erste Überwachungssystem im Jahr 2010 installiert. Insgesamt haben wir mehr als 15 Überwachungssysteme für Rechenzentren implementiert. Einerseits ist die Arbeit jedes Mal gleich, andererseits hat jeder Kunde seine eigenen Bedingungen und Anforderungen, sodass an jedes Projekt etwas anderes erinnert wird. Im Folgenden werde ich über die interessantesten Projekte der letzten Jahre sprechen.
NIS GLONASS
Zwei Rechenzentren befanden sich in Moskau und St. Petersburg. Sie waren durch ein einziges Überwachungssystem der technischen Infrastruktur verbunden. Zum ersten Mal in diesem Projekt mussten Benutzer Benutzerrechte gemeinsam nutzen, um auf Gerätegruppen zugreifen zu können. Wie ist es? Spezialisten aus Moskau kontrollierten alle Geräte in beiden Rechenzentren, während Spezialisten in St. Petersburg nur ihren Teil der Ausrüstung kontrollierten.
Projekt für eine metallurgische Anlage
Zum ersten Mal musste unser Team Geräte von Drittanbietern, einen Dieselgenerator, ein Automatisierungspanel und ein Bedienfeld für die
Klimaanlage an das Überwachungssystem
StruxureWare Data Center Expert „anschrauben“. Nicht ohne die Hilfe westlicher Experten des Support-Service des Herstellers des Überwachungssystems. Einen Monat lang haben sie Treiber für die Geräte geschrieben, die wir brauchen.
Staatliche Forschungseinheit
Hier haben wir zusätzlich zur Standardlösung erstmals die Überwachung einer Eingangsschaltanlage mit Leistungsschaltern implementiert, die von einem programmierbaren ZelioLogic-Relais gesteuert werden, einer Stromverteilungsschalttafel mit Statusüberwachung von Leistungsschaltern am Acti-9 SmartLink-Controller und den Stromzählern von Schneider Electric PowerLogic.
Technopark
Zum ersten Mal im Land haben wir Überwachungssysteme und Infrastrukturmanagementsysteme für Rechenzentren mit 190 drahtlosen Temperatur- und Feuchtigkeitssensoren in 6 Maschinenräumen und 4 Geräteräumen implementiert.
Relativ bald wird ein weiteres Großprojekt beginnen. Für uns wird es eine neue Erfahrung sein. Für Rechenzentren Aegis DCIM (tschechischer Hersteller CONTEG) müssen Überwachungssysteme RAMOS und das Infrastrukturmanagementsystem implementiert werden. Vielleicht gibt es wieder einen Grund, Ihnen etwas zu sagen.
Unser Team ist übrigens immer auf der Suche nach talentierten und begeisterten Fachleuten.