Todo está bajo control. ¿Por qué necesitamos sistemas de monitoreo para la infraestructura de ingeniería de los centros de datos?

Habr, hola!

Soy un ingeniero líder en LANIT-Integration . He estado trabajando aquí por más de 20 años. Durante los últimos siete años, he estado involucrado en el soporte de ingeniería de centros de datos: instalo y pongo en funcionamiento el equipo.

Cada año hay más y más requisitos de confiabilidad y usabilidad de los centros de datos. Sin embargo, esto no se puede lograr si nos centramos solo en las copias de seguridad del sistema y la calidad de los elementos individuales. El mercado comprende esta idea simple, por lo que las empresas están introduciendo cada vez más un sistema de monitoreo unificado. En resumen, monitorea la infraestructura de ingeniería del centro de datos y ayuda a evitar situaciones de emergencia.

En el artículo, hablaré sobre soluciones de monitoreo de hardware y software listas para usar que nosotros y mis colegas usamos en los proyectos.

Fuente

Para comenzar, hablaré sobre en qué consiste el núcleo de un centro de datos. Se divide en tres componentes.

  • Un sistema de telecomunicaciones recibe y transmite datos entre el centro de datos y sus usuarios, y también conecta los elementos del centro.
  • La arquitectura técnica es servidores de acceso, servidores de aplicaciones, servidores DBMS, sistemas de almacenamiento de datos. Ella es responsable del funcionamiento de las aplicaciones comerciales y permite a los usuarios acceder a ellas.
  • La infraestructura de ingeniería garantiza que todos los sistemas funcionen correctamente, es decir, admite condiciones óptimas para ellos.

La infraestructura de ingeniería de los centros de datos también se divide en dos subsistemas: funcionamiento y seguridad. El primero incluye sistemas de suministro de energía general, garantizado e ininterrumpido, acondicionamiento tecnológico, construcciones de montaje. El subsistema de seguridad incluye sistemas de alarma contra incendios, sistemas autónomos de extinción de incendios por gas, videovigilancia, control y gestión de acceso.

Para asegurarse de que todos los sistemas funcionan normalmente, se necesita un monitoreo constante, lo que proporciona monitoreo.

Fuente

El monitoreo ayuda a los ingenieros del centro de datos a trabajar más cómodamente. Sin ella, los especialistas deben vivir y trabajar todo el tiempo cerca de los gabinetes, o salir de la oficina y acudir a ellos cada vez que surge un problema o hay sospechas de que podría suceder.

Fuente

El monitoreo en tiempo real muestra cómo funciona la infraestructura del centro de datos. Los indicadores de desempeño generalmente son monitoreados por un turno de servicio. Si se produce una desviación o una emergencia, el personal de turno de servicio puede evitar una situación crítica a tiempo o minimizar sus consecuencias. Además, el sistema de monitoreo recopila datos sobre parámetros, estado del equipo, monitorea los términos de servicio, horas trabajadas, etc.

¿Qué controla exactamente el sistema de monitoreo y qué tareas resuelve?

  • Monitorea los parámetros de la red de suministro de energía y el estado de los interruptores automáticos;



  • supervisa el estado y los parámetros de funcionamiento de las fuentes de alimentación ininterrumpida;


  • monitorea el estado y los parámetros de operación de máquinas de refrigeración, aires acondicionados y unidades de ventilación;


  • recopila datos sobre temperatura y humedad, aprende sobre la presencia de fugas y humo en el centro de datos;


  • crea informes y gráficos sobre los parámetros requeridos;


  • envía notificaciones de cualquier evento y emergencia;


Protección de las personas


Desafortunadamente, las estadísticas dicen que muchas situaciones de emergencia con equipos ocurren debido a fallas humanas. Es por eso que el monitoreo, entre otras cosas, monitorea no solo los parámetros, sino también aquellos que tienen acceso al centro de datos y quién / qué lo hace.



Tipos de sistemas de monitoreo
Hay muchos sistemas diferentes que de alguna manera le permiten controlar los parámetros y la operación de varios tipos de equipos: monitoreo de sistemas de TI, monitoreo de SCS / LAN, monitoreo de sistemas de ingeniería, etc.

Por el tipo de implementación, los sistemas se dividen en software, hardware y soluciones híbridas.

Según el nivel de control, los sistemas de monitoreo se dividen en distribuidos y centralizados.

Los sistemas distribuidos le permiten monitorear el estado de uno o más dispositivos del mismo tipo.

Los sistemas centralizados permiten combinar todos los equipos controlados, incluidos varios sistemas distribuidos, en un solo sistema que le permite controlar el funcionamiento de todos los equipos en una "ventana única".

Fuente

En que consiste


Durante muchos años, mis colegas y yo hemos estado trabajando con el sistema de monitoreo NetBotz y el sistema de administración de infraestructura para el centro de datos StruxureWare Data Center Expert de APC by Schneider Electric. Nuestro equipo tiene certificación de afiliados de DCIM.

La mayoría de los fabricantes de equipos de ingeniería tienen soluciones integrales. Con su ayuda, puede crear una infraestructura de ingeniería de centro de datos llave en mano y ensamblar un sistema de monitoreo "fuera de cubos".

Esto es:

  • Controladores de monitoreo: dispositivos a los que se conectan todo tipo de sensores y que recopilan información de estos sensores;
  • expansores de puerto para conectar sensores: unidades adicionales que están conectadas a controladores de monitoreo para aumentar la cantidad de sensores conectados;
  • temperatura, humedad, fugas, humo, puerta abierta, movimiento, vibración, sensores analógicos de 4-20 mA y 0-5 voltios, contactos secos, etc.
  • dispositivos para controlar y restringir el acceso tanto a gabinetes de comunicación como a habitaciones;
  • cámaras de seguridad

Sin embargo, los sistemas confeccionados también tienen desventajas. Como regla general, cada fabricante ofrece un sistema de monitoreo para su equipo, es decir, uno que él produce. Por supuesto, es muy conveniente cuando la infraestructura del centro de datos se basa en el equipo de una marca. La implementación de dicho sistema lleva poco tiempo, no hay problema para conectar y reconocer los parámetros del equipo.

Fuente

Previsiblemente, el principal problema de tales sistemas es la conexión de equipos de terceros. Sucede que dichos sistemas admiten algunos tipos y modelos de equipos de terceros, pero para la conexión y visualización correcta de los parámetros, a menudo se requieren pasos y tiempos adicionales.

Por ejemplo, para conectar dispositivos de otras marcas que estén conectados a través de MODBUS al sistema APC Data center Expert que no están en la lista de soporte, debe comunicarse con el servicio de soporte. En este caso, debe proporcionar datos técnicos sobre el equipo conectado, completar varios formularios y esperar aproximadamente un mes. Es casi imposible hacer esto solo.

Instalación y configuración


De la teoría a la práctica. Instalamos el primer sistema de monitoreo en 2010. En total, hemos implementado más de 15 sistemas de monitoreo de centros de datos. Por un lado, el trabajo es el mismo cada vez, por otro lado, cada cliente tiene sus propias condiciones y requisitos, por lo que cada proyecto es recordado por algo diferente. A continuación hablaré sobre los proyectos más interesantes de los últimos años.

NIS GLONASS


Dos centros de datos se ubicaron en Moscú y San Petersburgo. Estaban conectados por un único sistema de monitoreo de infraestructura de ingeniería. Por primera vez en este proyecto, los usuarios tuvieron que compartir los derechos de los usuarios para acceder a los grupos de dispositivos. Como es eso Los especialistas de Moscú controlaron todos los dispositivos en ambos centros de datos, mientras que los especialistas en San Petersburgo controlaron solo su parte del equipo.


Proyecto para una planta metalúrgica.


Por primera vez, nuestro equipo tuvo que "atornillar" equipos de terceros, un grupo electrógeno diesel, un panel de automatización y un panel de control de aire acondicionado al sistema de monitoreo StruxureWare Data Center Expert . No sin la ayuda de expertos occidentales del servicio de soporte del fabricante del sistema de monitoreo. Durante un mes escribieron controladores para los dispositivos que necesitamos.



Unidad de Investigación de propiedad estatal


Aquí, además de la solución estándar, implementamos por primera vez la supervisión del cuadro de distribución del interruptor de entrada con interruptores automáticos, controlados por el relé programable ZelioLogic, el panel de distribución de energía con el estado de los interruptores automáticos en el controlador Acti-9 SmartLink y los medidores de electricidad PowerLogic de Schneider Electric.


Technopark


Por primera vez en el país, implementamos sistemas de monitoreo y sistemas de administración de infraestructura de centros de datos utilizando 190 sensores inalámbricos de temperatura y humedad ubicados en 6 salas de máquinas y 4 salas de equipos.


Relativamente pronto, otro gran proyecto comenzará. Para nosotros será una nueva experiencia. Es necesario implementar sistemas de monitoreo RAMOS y el sistema de gestión de infraestructura para centros de datos Aegis DCIM (fabricante checo CONTEG). Quizás haya otra vez una razón para decirte algo.

Por cierto, nuestro equipo siempre está buscando profesionales talentosos y entusiastas.

Source: https://habr.com/ru/post/es428467/


All Articles