Ao longo do meu trabalho, observei periodicamente situações em que a implementação do monitoramento na empresa não trazia os resultados esperados. O monitoramento não funcionou bem ou nem funcionou. Analisando essas situações, percebi que suas causas eram quase sempre as mesmas. Embora todos estejam na superfície, eu os encontrei o tempo todo e, portanto, decidi reuni-los para que você seja avisado e armado.

1. NÃO implemente uma ferramenta de monitoramento
Se os departamentos de TI receberem apenas uma ferramenta de monitoramento, o monitoramento eficaz e relevante não ocorrerá por si só. Em vez de introduzir um sistema de monitoramento, tente abordar a criação da infraestrutura de TI de monitoramento como uma organização de
processos .
O que quero dizer com processo de monitoramento?
O processo de monitoramento é uma combinação de recursos humanos, meios técnicos e medidas organizacionais destinadas a resolver as tarefas que a empresa propõe ao monitoramento durante a operação da infraestrutura de TI. Quero especialmente observar que as pessoas e as regras nesta definição não são menos importantes, mas mais do que meios técnicos.
Aqui estão alguns exemplos típicos dos nomes dos projetos de monitoramento dos quais participei. O nome do projeto na maioria dos casos reflete com precisão o resultado que o cliente queria receber:
- Implementação de um sistema corporativo de gerenciamento e operação de redes de telecomunicações
- Criando um sistema de monitoramento de infraestrutura de TI
- Desenvolvimento de um sistema de controle e operação do circuito da Internet
- Implementação do sistema de monitoramento de equipamentos de comutação da OJSC
- Criação de um sistema de gerenciamento de tecnologia da informação
- Criação de um complexo de hardware e software para o sistema de gerenciamento e monitoramento da infraestrutura de TI
As empresas se concentram na tecnologia e costumam sacrificar os outros dois componentes - recursos humanos e medidas organizacionais. Como resultado, a ferramenta aparece, mas um entendimento claro de
quem e
como deve usar essa ferramenta não é.
Naturalmente, em qualquer projeto de implementação de sistema de monitoramento, em um grau ou outro, existe um modelo e uma documentação que o acompanha. Mas, como regra, essa documentação é formal e não ajuda os departamentos de TI a responder perguntas que surgem ao trabalhar com o sistema.
2. O integrador NÃO fará todo o trabalho por você
Normalmente, para projetos relacionados ao monitoramento, grandes e médias empresas atraem especialistas de empresas integradoras. No processo de examinar a infraestrutura, os integradores contam com
sua experiência de conhecimento e solução de problemas. Mas longe do fato de que é exatamente isso que a empresa precisa. Ninguém conhece os meandros dos problemas associados à operação da infraestrutura de TI, melhor do que os especialistas da empresa.
Portanto, recomendo antes de
identificar um fornecedor terceirizado para
determinar independentemente
os problemas que a empresa deseja resolver por meio do monitoramento. Por exemplo:
- distribuição desigual de carga na infraestrutura virtual;
- alto número de acidentes na infraestrutura de TI;
- um alto grau de carregamento de especialistas altamente qualificados, executando tarefas simples;
- baixa disponibilidade de serviços corporativos;
- um grande número de chamadas para a primeira linha;
- muito tempo desde o momento da ocorrência do acidente até sua detecção;
- a necessidade de otimizar o trabalho dos administradores de sistema;
- baixa produtividade da infraestrutura de TI;
- falta de dados confiáveis sobre os recursos da infraestrutura de TI;
- falta de ferramentas de prevenção de acidentes.
Também será extremamente útil, mesmo nos estágios iniciais do monitoramento, para
corrigir métricas que quantificarão problemas e coletarão estatísticas sobre essas métricas. Como resultado, receberemos informações sobre o estado de funcionamento da infraestrutura de TI antes de organizar o processo de monitoramento. E após a implementação do monitoramento, podemos controlar como a organização influenciou a mudança nesses indicadores. Exemplos dessas métricas são:
- número médio de incidentes registrados durante o período do relatório;
- tempo de inatividade médio dos principais serviços;
- % Média de disponibilidade da infraestrutura de TI;
- % média de utilização da infraestrutura;
- o número de chamadas para a primeira linha do período coberto pelo relatório;
- tempo médio desde o momento em que o incidente ocorreu até sua descoberta;
Quanto melhores as métricas que caracterizam os principais problemas de operação da infraestrutura de TI, maior será sua melhoria durante o monitoramento. O cálculo constante dessas métricas deve ser parte integrante do processo. Com uma certa frequência, é necessário revisar as fórmulas para seu cálculo. Assim, você pode responder atempadamente às mudanças no desenvolvimento da infraestrutura de TI, sua composição qualitativa e quantitativa. É aconselhável usar essas métricas como KPIs ao avaliar o desempenho das unidades de suporte da infraestrutura de TI.
3. NÃO confunda monitoramento e administração da infraestrutura de TI
Profissionais qualificados são um dos três componentes principais de um processo de monitoramento eficaz. Às vezes, para economizar dinheiro, especialmente durante o processo de implementação, as empresas tentam
confiar o suporte e o desenvolvimento do sistema de monitoramento aos administradores de sistema envolvidos na operação da infraestrutura de TI. Mas se você selecionar uma estrutura separada (especialista) para dar suporte ao monitoramento, isso aumentará significativamente a qualidade do serviço. O monitoramento será para esses funcionários a atividade
principal , e não secundária, para que eles estejam muito mais interessados em seu sucesso e relevância.
As responsabilidades da unidade de monitoramento (especialista), entre outras, devem incluir as seguintes funções:
- administração de um complexo de sistemas de monitoramento;
- criação de novas métricas de monitoramento;
- ajuste de limiares de monitoramento;
- desenvolvimento de novas ferramentas de monitoramento;
- execução de solicitações de usuários;
- relatórios;
- desenvolvimento do processo de monitoramento de TI como um todo.
Mesmo que vários departamentos de TI se envolvam em conjunto na configuração do monitoramento, você ainda
precisa ter uma estrutura separada - um centro de conhecimento para tudo relacionado ao monitoramento . Isso ajudará a evitar custos duplicados de mão de obra e a resolver rapidamente quaisquer situações de conflito que, quando co-administradas, surgirão mais cedo ou mais tarde.
4. NÃO espere que seus subordinados usem o monitoramento se você não o fizer.
Acontece que o chefe, que iniciou a implementação do monitoramento na empresa, fornece as instruções necessárias, aloca recursos, conclui um acordo com o integrador, e isso conclui o trabalho com o monitoramento. E em vão, porque, para que o monitoramento seja eficaz, ele deve estar de uma forma ou de outra em demanda em todos os níveis da hierarquia corporativa. Assim que o gerente começar a usar o serviço de monitoramento, ele se tornará automaticamente obrigatório para todos os seus subordinados.

5. NÃO force os funcionários a trabalhar com o sistema de monitoramento
Mais cedo ou mais tarde, a implementação do sistema de monitoramento é concluída e sua operação começa. Às vezes, isso é acompanhado por um pedido: todos os departamentos de TI começam a trabalhar com o sistema. Como regra, a coerção direta não traz resultados positivos. O máximo que pode ser alcançado é a execução formal no valor mínimo necessário.
O monitoramento será recebido positivamente se ajudar cada unidade a resolver seus problemas. Se os departamentos de operações de TI não começarem a usar o monitoramento, isso pode indicar que os objetivos de implementação do monitoramento foram definidos incorretamente. Ou que os objetivos da implementação não coincidem com os dos departamentos de TI.
Motive os departamentos da empresa a usar os resultados do monitoramento e não os obrigue a fazê-lo. Uma boa opção para essa motivação seria criar para cada unidade os principais indicadores baseados em métricas que descrevem os problemas de operação da infraestrutura de TI em termos quantitativos. Eu dei os exemplos acima.
6. NÃO se concentre em testar a funcionalidade do sistema de monitoramento durante o teste.
Após o desenvolvimento do sistema de monitoramento, ele é testado e depois testado. Aqui nosso próximo "não" se torna relevante. De uma forma ou de outra, me deparei com esse problema em todos os projetos.
Se a implementação da ferramenta de monitoramento for realizada por uma organização terceirizada, é importante que os especialistas da empresa participem ativamente da formação de métodos de teste do sistema nas etapas de teste de aceitação e operação de teste. Durante o teste, é necessário se concentrar com precisão
se a ferramenta realmente ajuda a atingir as metas e objetivos estabelecidos para o monitoramento .
Aqui estão alguns exemplos de uso de métricas para os testes finais:
- Otimização da utilização da infraestrutura de TI. Com base nos relatórios do sistema de monitoramento, é possível tomar decisões inequívocas e motivadas sobre o descarte ideal e a distribuição mais racional da infraestrutura de TI.
- Reduzindo o número de acidentes na infraestrutura de TI. O monitoramento da infraestrutura de TI deve fornecer o maior número possível de sinais corretos e o menor número possível de falsos. Você pode verificar isso coletando estatísticas sobre a porcentagem de sinais do sistema de monitoramento que realmente relatam o estado de emergência dos componentes da infraestrutura de TI e levaram a uma reação para eliminar as causas do acidente.
- Reduzindo a carga de especialistas altamente qualificados, executando tarefas simples. Verificar a integridade e os detalhes do modelo construído no sistema, bem como a integridade de seu preenchimento com informações sobre as unidades estruturais da empresa, análise das regras para escalar alertas, caso o sistema as forneça. Também será útil determinar a porcentagem de sinais que atingem os destinatários alvo e comparar esse valor com os indicadores alvo.
- Melhorando a disponibilidade de serviços corporativos . Comparação de indicadores de acessibilidade de serviços corporativos definidos pelo sistema de monitoramento com indicadores reais de disponibilidade para o período coberto pelo relatório, determinados por métodos alternativos. Isso também inclui a verificação da integridade e os detalhes da lista de métricas usadas para determinar a disponibilidade dos serviços corporativos, os valores limite dessas métricas e a definição de alertas para grupos de suporte de serviços corporativos.
- Verificação da qualidade dos serviços de TI fornecidos por um contratado externo . Verificação de que as métricas de monitoramento dos serviços fornecidos cobrem os parâmetros do SLA assinado com um contratado externo na máxima extensão possível. Com base nos dados deles, podemos dizer claramente que o contratado está cumprindo as condições do SLA.
- Inventário da infraestrutura de TI. Verificar a integridade das informações de inventário coletadas pelo sistema de monitoramento e sua conformidade com os requisitos e objetivos do inventário; verificação da qualidade e facilidade de uso dos relatórios de inventário emitidos pelo sistema de monitoramento.
- Aviso proativo de acidente. Comparação de estatísticas sobre o número de acidentes no período coberto pelo relatório antes do início do uso do sistema de monitoramento e após sua colocação em operação experimental; comparando esses valores com as metas.
Por um lado, é muito difícil verificar isso. Você precisa primeiro determinar o método de cálculo dessas métricas e depois acumular estatísticas sobre elas. Por outro lado, essas métricas podem ser usadas não apenas no processo de teste de monitoramento, mas também estabelecidas no futuro no sistema de motivação dos departamentos de TI envolvidos na operação.
A verificação da funcionalidade básica - por exemplo, a aparência de um alarme no sistema de monitoramento no caso de uma falha de energia no comutador - por si só não dá nenhuma idéia de que o sistema irá lidar com suas tarefas. Essa verificação mostrará apenas que o sistema basicamente funciona.
7. O monitoramento NÃO começará a ser benéfico até você começar a trabalhar com ele e adaptá-lo às suas necessidades.
Este "não" refere-se ao estágio de operação do sistema após a conclusão da implementação. É extremamente importante entender que, sem um processo de monitoramento adequadamente construído e sua atualização, os dados no sistema começarão a ficar obsoletos imediatamente após a conclusão de sua implementação.
No momento do comissionamento, todas as questões organizacionais relacionadas à manutenção do sistema e ao funcionamento do monitoramento, as regras para seu uso e a divisão de responsabilidades e suporte devem ser resolvidas na medida do possível. As regras e procedimentos para resolver problemas que surgirão durante a operação também devem ser definidos. A ausência dessas regras é a principal razão pela qual o monitoramento deixa de funcionar e o integrador começa a se degradar após a conclusão da fase ativa do trabalho.
Finalmente, no início da operação comercial do sistema de monitoramento, devem ser elaborados regulamentos em que as regras básicas de trabalho dentro do processo de monitoramento serão formuladas:
- quem e como trabalhará com o sistema;
- quem é responsável por manter o sistema atualizado;
- quem tem o direito de ajustar os valores métricos de limite;
- como é a criação de novas métricas;
- em que casos novas métricas devem ser criadas;
- quanto tempo ocorre a criação de novas métricas;
- o que deveria acontecer se o sistema de monitoramento registrasse um acidente;
- quem e como deve responder a este acidente;
- quem é responsável pelo funcionamento do sistema de monitoramento;
- como serão resolvidos os conflitos relacionados à aparência de falsos ou à falta de sinais corretos.
Conclusão
Eu realmente espero que depois de ler meu artigo, você não encontre situações semelhantes ao que está acontecendo em sua empresa. Caso o monitoramento esteja apenas começando a se desenvolver em sua empresa, as informações sobre esses sete principais erros, na minha opinião, no processo de implementação do monitoramento ajudarão você a criar um processo eficaz que trará estabilidade ao trabalho de sua infraestrutura de TI.