Por que você precisa do Splunk? Monitorando a infraestrutura de TI



  • Como a desativação de um único servidor afetou a integridade da infraestrutura como um todo?
  • É possível prever a deterioração da infraestrutura?
  • Qual o impacto que os serviços críticos têm no sistema?

Neste artigo, falaremos sobre como o Splunk pode ajudá-lo a encontrar respostas para essas perguntas.

Hoje, continuaremos falando sobre os recursos do sistema Splunk , especializado em coletar dados de log em tempo real, processar e executar pesquisas complexas, análise de dados em tempo real e criar painéis e alertas dinâmicos.

Em artigos anteriores, já escrevemos sobre como o Splunk pode ser usado para analisar o desempenho de aplicativos , analisar eventos de segurança , bem como dados industriais e a Internet das coisas .

Quanto ao monitoramento da infraestrutura de TI, é útil nos casos em que seu objetivo não é focar no que está funcionando no momento, mas saber o que está quebrado ou no modo crítico, se há perdas de desempenho em serviços individuais .
Muitos problemas a longo prazo podem levar à redução da satisfação e perda de clientes, perda de tempo dos funcionários e dinheiro da organização devido ao tempo de inatividade do equipamento. Portanto, é importante aprender como progredir e identificar problemas antes que eles surjam.

As tarefas que podem ser resolvidas pelo monitoramento da infraestrutura de TI podem ser divididas em 4 áreas:

  1. Consciência situacional é a definição do que funciona bem e do que precisa ser corrigido.
  2. Planejamento de desempenho e capacidade - avaliar com o tempo os valores dos indicadores de desempenho e sua dependência de outros indicadores, com base nos quais é possível obter previsões de desempenho e capacidade.
  3. Investigação de incidentes - realização de uma análise dos logs, que pode restaurar a imagem completa do incidente.
  4. Relatórios - criação de gráficos e relatórios atualizados em tempo real.

Vamos dar uma olhada no que o Splunk pode nos oferecer para monitorar a infraestrutura:

Integração total

Com a ajuda do Splunk, você pode integrar totalmente todos os sistemas, aplicativos e complementos, combinando dados aparentemente não relacionados entre si. Configurar hosts e obter os primeiros logs e métricas geralmente requer muito pouco tempo.



Monitoramento e correlação contínuos

O monitoramento constante em tempo real e os indicadores correlatos com base nos dados de todos os dispositivos permitem que você veja uma imagem completa do desempenho do sistema, identifique anomalias e causas principais de problemas e determine áreas de impacto.





Previsão

Com base em dados históricos e KPIs complexos, é possível prever o nível de integridade da infraestrutura, o que evitará problemas de funcionamento do sistema antes que eles ocorram.

Filtrando eventos e reduzindo o tempo de investigação

O uso de algoritmos de aprendizado de máquina permite reduzir automaticamente o número de eventos àqueles que exigem maior atenção. Uma visibilidade abrangente dos eventos e a construção de previsões reduzirão o tempo de investigação de incidentes e reduzirão o número total de incidentes e falhas.

Visualizações e alertas personalizáveis




A capacidade de criar vários relatórios e visualizações de seus serviços de TI, principais indicadores e tendências. Os painéis de relatórios podem variar e são facilmente personalizáveis ​​para diferentes categorias de usuários. E também com base nos valores de vários indicadores, um grupo de indicadores ou eventos específicos, você pode configurar alertas para relatar problemas rapidamente e responder o mais rápido possível.



Soluções prontas


O Splunk possui várias soluções prontas que permitem implementar rapidamente o monitoramento da infraestrutura de TI. Isso é o Splunk Insights for Infrastructure www.splunk.com/en_us/software/splunk-enterprise/infrastructure-insights.html e o Splunk IT Service Intelligence (ITSI), que examinamos em detalhes anteriormente .




Source: https://habr.com/ru/post/pt421797/


All Articles