A lo largo de mi trabajo, observé periódicamente situaciones en las que la implementación del monitoreo en la empresa no arrojó los resultados esperados. El monitoreo no funcionó bien o no funcionó en absoluto. Al analizar tales situaciones, me di cuenta de que sus causas eran casi siempre las mismas. Aunque todos yacen en la superficie, me reuní con ellos todo el tiempo y, por lo tanto, decidí juntarlos para que te advirtieran y armaras.

1. NO implemente una herramienta de monitoreo
Si los departamentos de TI reciben solo una herramienta de monitoreo, el monitoreo efectivo y relevante no surgirá por sí solo. En lugar de introducir un sistema de monitoreo, intente abordar la creación de infraestructura de monitoreo de TI como una organización de
procesos .
¿Qué quiero decir con el proceso de monitoreo?
El proceso de monitoreo es una combinación de recursos humanos, medios técnicos y medidas organizativas destinadas a resolver las tareas que la empresa plantea al monitoreo durante la operación de la infraestructura de TI. Especialmente quiero señalar que las personas y las reglas en esta definición no son menos importantes, sino más bien que medios técnicos.
Aquí hay algunos ejemplos típicos de los nombres de los proyectos de monitoreo en los que una vez participé. El nombre del proyecto en la mayoría de los casos refleja con precisión el resultado que el cliente quería recibir:
- Implementación de un sistema corporativo de gestión y operación de redes de telecomunicaciones.
- Crear un sistema de monitoreo de infraestructura de TI
- Desarrollo de un sistema de control y operación del circuito de Internet.
- Implementación del sistema de monitoreo de equipos de conmutación de OJSC
- Creación de un sistema de gestión de tecnología de la información.
- Creación de un complejo de hardware y software para el sistema de gestión y monitoreo de la infraestructura de TI.
Las empresas se centran en la tecnología y con mayor frecuencia sacrifican los otros dos componentes: recursos humanos y medidas organizativas. Como resultado, aparece la herramienta, pero no es una comprensión clara de
quién y
cómo debe usar esta herramienta.
Naturalmente, en cualquier proyecto de implementación del sistema de monitoreo, en un grado u otro, hay tanto un modelo a seguir como la documentación que lo acompaña. Pero, por regla general, esta documentación es formal y no ayuda a los departamentos de TI a responder las preguntas que surgen cuando se trabaja con el sistema.
2. El integrador NO hará todo el trabajo por usted
Por lo general, para proyectos relacionados con el monitoreo, las empresas grandes y medianas atraen especialistas de empresas integradoras. En el proceso de examinar la infraestructura, los integradores confían en
su conocimiento y experiencia en la resolución de problemas. Pero lejos del hecho de que esto es exactamente lo que necesita la empresa. Nadie conoce las complejidades de los problemas asociados con la operación de la infraestructura de TI, mejor que los especialistas de la compañía.
Por lo tanto, recomiendo antes de
identificar a un contratista externo para
determinar de forma independiente
los problemas que la empresa quiere resolver mediante el monitoreo. Por ejemplo:
- distribución desigual de la carga en la infraestructura virtual;
- alto número de accidentes en la infraestructura de TI;
- un alto grado de carga de especialistas altamente calificados realizando tareas simples;
- baja disponibilidad de servicios corporativos;
- una gran cantidad de llamadas a la primera línea;
- mucho tiempo desde el momento en que ocurrió el accidente hasta su detección;
- la necesidad de optimizar el trabajo de los administradores del sistema;
- baja productividad de la infraestructura de TI;
- falta de datos confiables sobre recursos de infraestructura de TI;
- falta de herramientas de prevención de accidentes.
También será extremadamente útil, incluso en las primeras etapas de la supervisión, para
corregir las métricas que cuantificarán los problemas y recopilarán estadísticas sobre estas métricas. Como resultado, recibiremos información sobre el estado de funcionamiento de la infraestructura de TI antes de organizar el proceso de monitoreo. Y después de la implementación del monitoreo, podemos controlar cómo la organización influyó en el cambio en estos indicadores. Ejemplos de tales métricas son:
- número promedio de incidentes registrados durante el período del informe;
- tiempo de inactividad promedio de servicios clave;
- % Promedio de disponibilidad de infraestructura de TI;
- % promedio de utilización de infraestructura;
- el número de llamadas a la primera línea para el período del informe;
- tiempo promedio desde el momento en que ocurrió el incidente hasta su descubrimiento;
Mientras se resuelvan las mejores métricas que caracterizan los principales problemas de operación de la infraestructura de TI, mayor será su mejora durante el monitoreo. El cálculo constante de estas métricas debería ser una parte integral del proceso. Con cierta frecuencia, es necesario revisar las fórmulas para su cálculo. Para que pueda responder oportunamente a los cambios en el desarrollo de la infraestructura de TI, su composición cualitativa y cuantitativa. Es recomendable utilizar estas métricas como KPI al evaluar el rendimiento de las unidades de soporte de infraestructura de TI.
3. NO confunda el monitoreo y la administración de la infraestructura de TI
Los profesionales calificados son uno de los tres componentes clave de un proceso de monitoreo efectivo. A veces, para ahorrar dinero, especialmente durante el proceso de implementación, las empresas intentan
confiar el soporte y el desarrollo del sistema de monitoreo a los administradores del sistema involucrados en la operación de la infraestructura de TI. Pero si selecciona una estructura separada (especialista) para soportar el monitoreo, esto aumentará significativamente la calidad del servicio. El monitoreo será para estos empleados la actividad
principal , y no secundaria, para que estén mucho más interesados en su éxito y relevancia.
Las responsabilidades de la unidad de monitoreo (especialista), entre otras, deben incluir las siguientes funciones:
- administración de un complejo de sistemas de monitoreo;
- creación de nuevas métricas de monitoreo;
- ajuste de umbrales de monitoreo;
- desarrollo de nuevas herramientas de monitoreo;
- ejecución de solicitudes de usuarios;
- informes;
- desarrollo del proceso de monitoreo de TI en su conjunto.
Incluso si varios departamentos de TI participarán conjuntamente en la configuración de la supervisión, aún
debe tener una estructura separada, un centro de experiencia para todo lo relacionado con la supervisión . Esto ayudará a evitar costos de mano de obra duplicados y resolverá rápidamente cualquier situación de conflicto que, cuando se administre conjuntamente, surgirá tarde o temprano.
4. NO espere que sus subordinados usen monitoreo si usted mismo no lo hace.
Sucede que el jefe, que comenzó la implementación del monitoreo en la empresa, da las instrucciones necesarias, asigna fondos, concluye un acuerdo con el integrador y esto completa el trabajo con el monitoreo. Y en vano, porque para que el monitoreo sea efectivo, debe ser de una forma u otra en demanda en todos los niveles de la jerarquía corporativa. Tan pronto como el gerente comience a usar el servicio de monitoreo, será automáticamente obligatorio para todos sus subordinados.

5. NO obligue a los empleados a trabajar con el sistema de monitoreo
Tarde o temprano, la implementación del sistema de monitoreo se completa y comienza su operación. A veces esto va acompañado de una orden: todos los departamentos de TI para comenzar a trabajar con el sistema. Como regla, la coerción directa no trae resultados positivos. Lo máximo que se puede lograr es la ejecución formal en la cantidad mínima necesaria.
El monitoreo será recibido positivamente si ayuda a cada unidad a resolver sus problemas. Si los departamentos de operaciones de TI no comienzan a utilizar la supervisión, esto puede indicar que los objetivos de implementación de la supervisión se establecieron incorrectamente. O que los objetivos de implementación no coinciden con los objetivos de los departamentos de TI.
Motive a los departamentos de la empresa a usar los resultados de monitoreo y no los obligue a hacerlo. Una buena opción para tal motivación sería crear para cada unidad indicadores clave basados en métricas que describan los problemas de operar la infraestructura de TI en términos cuantitativos. Di sus ejemplos arriba.
6. NO se concentre en probar la funcionalidad del sistema de monitoreo durante su prueba.
Después del desarrollo del sistema de monitoreo, se prueba y luego se prueba la operación. Aquí nuestro próximo "no" se vuelve relevante. En un grado u otro, me encontré con este problema en cada proyecto.
Si la implementación de la herramienta de monitoreo es realizada por una organización externa, es importante que los especialistas de la compañía participen activamente en la formación de métodos de prueba del sistema en las etapas de prueba de aceptación y operación de prueba. Durante las pruebas, es necesario concentrarse con precisión en
si la herramienta realmente ayuda a alcanzar las metas y objetivos establecidos para el monitoreo .
Estos son algunos ejemplos del uso de métricas para las pruebas finales:
- Optimización de la utilización de la infraestructura de TI. Según los informes del sistema de monitoreo, es posible tomar decisiones inequívocas y motivadas con respecto a la disposición óptima y la distribución más racional de la infraestructura de TI.
- Reducción del número de accidentes en la infraestructura de TI. El monitoreo de la infraestructura de TI debe dar tantas señales correctas como sea posible y la menor cantidad posible de señales falsas. Puede verificar esto mediante la recopilación de estadísticas sobre el porcentaje de señales del sistema de monitoreo que realmente informan el estado de emergencia de los componentes de la infraestructura de TI y han llevado a una reacción para eliminar las causas del accidente.
- Reduciendo la carga de especialistas altamente calificados realizando tareas simples. Comprobando la integridad y el detalle del modelo a seguir construido en el sistema, así como la integridad de su llenado con información sobre las unidades estructurales de la empresa, el análisis de las reglas para la escalada de alertas en caso de que el sistema las proporcione. También será útil determinar el porcentaje de señales que llegan a los destinatarios objetivo y comparar este valor con los indicadores objetivo.
- Mejora de la disponibilidad de servicios corporativos . Comparación de los indicadores de accesibilidad de los servicios corporativos definidos por el sistema de monitoreo con los indicadores reales de disponibilidad para el período del informe, que se determinan por métodos alternativos. Esto también incluye verificar la integridad y el detalle de la lista de métricas utilizadas para determinar la disponibilidad de servicios corporativos, los valores de umbral de estas métricas y establecer alertas para los grupos objetivo de soporte de servicios corporativos.
- Verificación de la calidad de los servicios informáticos prestados por un contratista externo . Verificación de que las métricas de monitoreo de los servicios provistos cubren los parámetros del SLA firmado con un contratista externo en la mayor medida posible. Con base en sus datos, podemos decir claramente que el contratista cumple con las condiciones de SLA.
- Inventario de infraestructura de TI. Verificar la integridad de la información del inventario recopilada por el sistema de monitoreo y su cumplimiento con los requisitos y objetivos del inventario; verificar la calidad y facilidad de uso de los informes de inventario emitidos por el sistema de monitoreo.
- Advertencia proactiva de accidentes. Comparación de estadísticas sobre el número de accidentes durante el período del informe antes del inicio del uso del sistema de monitoreo y después de ponerlo en operación de prueba; comparando estos valores con los objetivos.
Por un lado, es bastante difícil verificar esto: primero debe determinar el método de cálculo de estas métricas y luego acumular estadísticas sobre ellas. Pero, por otro lado, estas métricas se pueden usar no solo en el proceso de prueba de monitoreo, sino también en el futuro en el sistema de motivación de los departamentos de TI involucrados en la operación.
La verificación de la funcionalidad básica, por ejemplo, la aparición de una alarma en el sistema de monitoreo en caso de una falla de energía en el interruptor, por sí sola, no da ninguna idea de que el sistema hará frente a sus tareas. Tal verificación solo mostrará que el sistema básicamente funciona.
7. El monitoreo NO comenzará a ser beneficioso hasta que comience a trabajar con él y lo adapte a sus necesidades.
Este "no" se refiere a la etapa de operación del sistema después de completar la implementación. Es extremadamente importante comprender que sin un proceso de monitoreo construido adecuadamente y su actualización, los datos en el sistema comenzarán a quedar obsoletos inmediatamente después de completar su implementación.
En el momento de la puesta en servicio, todos los problemas de organización relacionados con el mantenimiento del sistema y el funcionamiento del monitoreo, las reglas para su uso y la división de responsabilidades y apoyo deben resolverse en la medida de lo posible. También se deben definir las reglas y procedimientos para resolver los problemas que surgirán durante la operación. La ausencia de estas reglas es la razón principal por la cual el monitoreo deja de funcionar y el integrador comienza a degradarse después de la finalización de la fase activa del trabajo.
Finalmente, al comienzo de la operación comercial del sistema de monitoreo, se deben preparar regulaciones en las cuales se formularán las reglas básicas de trabajo dentro del proceso de monitoreo:
- quién y cómo trabajará con el sistema;
- quién es responsable de mantener actualizado el sistema;
- quién tiene derecho a ajustar los valores métricos del umbral;
- cómo es la creación de nuevas métricas;
- en cuyo caso se deben crear nuevas métricas;
- cuánto tiempo se produce la creación de nuevas métricas;
- qué debería pasar si el sistema de monitoreo registrara un accidente;
- quién y cómo debería responder a este accidente;
- quién es responsable del funcionamiento del sistema de monitoreo;
- cómo se resolverán los conflictos relacionados con la aparición de señales falsas o la falta de señales correctas.
Conclusión
Realmente espero que después de leer mi artículo, no encuentres situaciones similares a lo que está sucediendo en tu empresa. En el caso de que el monitoreo recién esté comenzando a desarrollarse en su empresa, la información sobre estos siete errores principales, en mi opinión, en el proceso de implementación del monitoreo lo ayudará a crear un proceso efectivo que brindará estabilidad al trabajo de su infraestructura de TI.