
- Como a desativação de um único servidor afetou a integridade da infraestrutura como um todo?
- É possível prever a deterioração da infraestrutura?
- Qual o impacto que os serviços críticos têm no sistema?
Neste artigo, falaremos sobre como o Splunk pode ajudá-lo a encontrar respostas para essas perguntas.
Hoje, continuaremos falando sobre os recursos do sistema
Splunk , especializado em coletar dados de log em tempo real, processar e executar pesquisas complexas, análise de dados em tempo real e criar painéis e alertas dinâmicos.
Em artigos anteriores, já escrevemos sobre como o Splunk pode ser usado para
analisar o desempenho de aplicativos ,
analisar eventos de segurança , bem como
dados industriais e a Internet das coisas .
Quanto ao monitoramento da infraestrutura de TI, é útil nos casos em que seu objetivo não é focar no que está funcionando no momento, mas saber o que está quebrado ou no modo crítico, se há perdas de desempenho em serviços individuais .
Muitos problemas a longo prazo podem levar à redução da satisfação e perda de clientes, perda de tempo dos funcionários e dinheiro da organização devido ao tempo de inatividade do equipamento. Portanto, é importante aprender como progredir e identificar problemas antes que eles surjam.
As tarefas que podem ser resolvidas pelo monitoramento da infraestrutura de TI podem ser divididas em 4 áreas:
- Consciência situacional é a definição do que funciona bem e do que precisa ser corrigido.
- Planejamento de desempenho e capacidade - avaliar com o tempo os valores dos indicadores de desempenho e sua dependência de outros indicadores, com base nos quais é possível obter previsões de desempenho e capacidade.
- Investigação de incidentes - realização de uma análise dos logs, que pode restaurar a imagem completa do incidente.
- Relatórios - criação de gráficos e relatórios atualizados em tempo real.
Vamos dar uma olhada no que o Splunk pode nos oferecer para monitorar a infraestrutura:
Integração totalCom a ajuda do Splunk, você pode integrar totalmente todos os sistemas, aplicativos e complementos, combinando dados aparentemente não relacionados entre si. Configurar hosts e obter os primeiros logs e métricas geralmente requer muito pouco tempo.
Monitoramento e correlação contínuosO monitoramento constante em tempo real e os indicadores correlatos com base nos dados de todos os dispositivos permitem que você veja uma imagem completa do desempenho do sistema, identifique anomalias e causas principais de problemas e determine áreas de impacto.
PrevisãoCom base em dados históricos e KPIs complexos, é possível prever o nível de integridade da infraestrutura, o que evitará problemas de funcionamento do sistema antes que eles ocorram.
Filtrando eventos e reduzindo o tempo de investigaçãoO uso de algoritmos de aprendizado de máquina permite reduzir automaticamente o número de eventos àqueles que exigem maior atenção. Uma visibilidade abrangente dos eventos e a construção de previsões reduzirão o tempo de investigação de incidentes e reduzirão o número total de incidentes e falhas.
Visualizações e alertas personalizáveis
A capacidade de criar vários relatórios e visualizações de seus serviços de TI, principais indicadores e tendências. Os painéis de relatórios podem variar e são facilmente personalizáveis para diferentes categorias de usuários. E também com base nos valores de vários indicadores, um grupo de indicadores ou eventos específicos, você pode configurar alertas para relatar problemas rapidamente e responder o mais rápido possível.

Soluções prontas
O Splunk possui várias soluções prontas que permitem implementar rapidamente o monitoramento da infraestrutura de TI. Isso é o Splunk Insights for Infrastructure
www.splunk.com/en_us/software/splunk-enterprise/infrastructure-insights.html e o Splunk IT Service Intelligence (ITSI), que examinamos em detalhes
anteriormente .
