Todo debería ser perfecto en una persona, pero en un centro de datos moderno todo debería funcionar como un reloj suizo. Ningún componente de la compleja arquitectura de los sistemas de ingeniería del centro de datos debe quedar sin la atención del servicio operativo. Fueron estas consideraciones las que nos guiaron en el centro de Linxdatacenter en San Petersburgo, preparándonos para la certificación de Uptime Management & Operations en 2018 y poniendo todos los sistemas de centros de datos de acuerdo con los mejores estándares internacionales.
Hoy les diré cómo y por qué presentamos el sistema de control remoto de presión y aire de “respaldo” en las salas de servidores. Permítame recordarle que en el proceso de preparación para la auditoría del Uptime Institute, una de las tareas a resolver fue el tema de la limpieza. Nuestro equipo trabajó en dos áreas: limpieza (anteriormente mi colega
ya habló sobre cómo combatimos el polvo en las salas de servidores) y monitorear la presión en las salas de servidores. Como ingeniero jefe de la compañía, el segundo me fue asignado.
De que estamos hablando
En cualquier sala de servidores hay un sistema de ventilación general. Está diseñado de manera muy simple: una máquina de ventilación funciona para suministrar aire hacia adentro, la segunda, para extraerlo hacia afuera. Ambos motores están controlados por reguladores de frecuencia, es decir, es posible cambiar la frecuencia de sus revoluciones y así regular los volúmenes de aire suministrado / eliminado.
Hay dos tareas para este sistema:
- Proporcione el intercambio de aire requerido para una estadía cómoda de personas en la sala de servidores (el número de personas se establece en función de los detalles de la sala),
- Proporcione un exceso de presión de aire en la sala del servidor para que las partículas de polvo no ingresen a la sala a través de puertas abiertas y mantenga la limpieza necesaria.
La máquina de ventilación de suministro debe suministrar más aire a la sala de servidores que la campana extractora. Esto proporciona un exceso de presión en la sala del servidor en relación con las habitaciones vecinas, la llamada "presión de aire". Con dicho sistema, el aire ingresa a la sala del servidor solo a través de los filtros de ventilación de suministro, y se excluye el suministro de aire sin filtrar a la sala del servidor.
Si de repente todo sucede al revés (la ventilación de extracción elimina más aire que el suministro de aire de suministro), entonces el aire sin filtrar comienza a fluir hacia la sala del servidor desde las habitaciones adyacentes, que a menudo es la causa del polvo en las superficies y en el equipo.
Sin control
Todo parece ser simple. Sin embargo, en el momento en que el trabajo comenzó a mejorar la calidad de la limpieza en el centro de datos, no teníamos una herramienta efectiva para controlar la presencia de agua estancada. Configuramos la frecuencia de alimentación para que sea mayor que la frecuencia de extracción, y luego realizamos la sintonización "a ojo". Las puertas de la sala de servidores se abren con dificultad (como atraídas hacia adentro): el remanso es negativo. Si, por el contrario, el cerrador no hace frente al cierre, significa que el remanso es muy fuerte. Buscando un cierto equilibrio entre estos dos estados, en algún lugar en el medio nos detuvimos.
Sin embargo, este enfoque no es confiable, y nos resultó imposible confiar más en él.
Por qué Trabajando "a simple vista", es imposible tener en cuenta la influencia del estado de los filtros de aire en la potencia de la ventilación de suministro. Si el filtro está limpio, veremos ciertos indicadores de resistencia y el volumen de aire suministrado; si el filtro está sucio, estos indicadores serán muy diferentes. Según la dinámica de abrir y cerrar la puerta, estos matices no se pueden rastrear.
Típicamente, el filtro se reemplaza por un medidor de presión diferencial mecánico estándar, que apaga la ventilación en una determinada etapa de contaminación del filtro (la diferencia de presión antes y después del filtro no debe exceder cierto indicador que corresponde a la norma de limpieza del filtro).
Resulta que hay un largo período de vida útil del filtro, mientras se ensucia gradualmente, y el manómetro de presión diferencial estándar de ventilación lo considera adecuado para el trabajo. Pero la potencia de ventilación y, por lo tanto, la fuerza de remanso varían según el estado del filtro.
Difmanómetro de ventilación nativa.Como resultado, llegamos a la conclusión de que el proceso de configuración y control de remanso en tal escenario es demasiado complicado y nuevamente ineficiente para el centro de datos.
Solución
Para la respuesta a la pregunta "¿Y qué hacemos?" recurrimos a las mejores prácticas mundiales, que ayudaron a un viaje a Estocolmo con un recorrido por los centros de datos locales.
En uno de los centros de datos vimos la solución que necesitábamos: se instaló un difmanómetro mecánico en la entrada de la sala de servidores y mostró la diferencia de presión "servidor / corredor".
Curiosamente, los colegas suecos usan difmanómetros en la entrada de los servidores y para controlar la contaminación del filtro de ventilación: cambian los filtros cuando disminuye la contrapresión, no esperaron una señal de un difmanómetro regular del sistema de ventilación. Las lecturas del manómetro monitorean visualmente a los asistentes en las rondas.
Al regresar, comenzamos a buscar equipos similares en Rusia. Resultó que tales difanómetros se usan en nuestras llamadas "salas limpias", es decir, en quirófanos, laboratorios, etc. Debido al estado especial de las instalaciones, los precios de este equipo eran altísimos.
Además, no necesitábamos un dispositivo analógico, sino uno digital, preferiblemente con una salida de 4-20 mA, para poder conectarlo al sistema de monitoreo del centro de datos. Esto era importante para establecer umbrales para enviar alertas y para recopilar y analizar estadísticas.
El que busca siempre encontrará
Tuvimos suerte: poco después del inicio de la búsqueda logramos encontrar el dispositivo necesario: un medidor de presión diferencial digital con una pantalla y una salida para conectarse al BMS con un presupuesto de aproximadamente 10,000 rublos por unidad.
Instalamos, ajustamos y nos preguntamos solo una cosa: por qué no lo habíamos adivinado antes y por qué esta solución no era estándar en los proyectos de centros de datos.
Se ve así:

Un difmanómetro electrónico en el corredor fuera de la sala del servidor, el tubo de un canal de medición se conduce a la sala del servidor, el segundo canal mide la presión en el corredor.Y así, el dispositivo se muestra en el sistema de monitoreo del centro de datos:
Estas son las estadísticas de las lecturas del manómetro en el sistema de monitoreo:

De acuerdo con GOST R ISO 14644-4-2002 "Salas limpias y entornos controlados asociados", tomados como una guía, "para la apertura sin obstrucciones de las puertas y la eliminación del flujo de aire entrante no deseado debido a turbulencias, como regla, la caída de presión entre salas limpias o Las zonas limpias con diferentes clases de pureza deben ser de 5 a 20 Pa ".
Es este rango el que hemos tomado como norma en el centro de datos. Tan pronto como se produce una desviación, se registra inmediatamente en el sistema, como se muestra en el gráfico a continuación.
Una fuerte caída de presión en el gráfico es una puerta abierta a la sala de servidores.Si el sensor lee por debajo de la configuración durante más de 5 minutos, significa algo con un filtro, se ha producido algún tipo de accidente, en una palabra, algo extraordinario. Específicamente en este gráfico, la razón es la apertura prolongada de la puerta para la entrega de equipos en la habitación.
Lo que tenemos
En primer lugar , un nuevo nivel de control y transparencia de los sistemas de ingeniería del centro de datos.
En segundo lugar , el control de la limpieza se ha vuelto aún más efectivo: el sistema le permite evitar la reducción del agua estancada y cambiar los filtros de aire de antemano o eliminar otras razones para su reducción.
En tercer lugar , todos estos procesos están controlados por herramientas matemáticamente precisas. Recopilamos el historial de observaciones en dinámica y tenemos estadísticas sobre la vida real de los filtros de aire y todas las situaciones de emergencia.
La auditoría realizada por Management & Operations y nuestra reciente visita a los centros de datos europeos mostraron que somos pioneros en esta dirección no solo en Rusia sino también en la UE, no todos los líderes en el mercado de centros de datos en Europa tienen tales soluciones.
Por supuesto, este sistema no es clave para la operación de los sistemas de ingeniería del sitio. Al mismo tiempo, esta es una adición extremadamente útil al servicio operativo y una excelente ilustración de nuestro centro de datos que cumple con los altos estándares. No hay pequeñeces en nuestra industria.