为什么需要Splunk? 监控IT基础架构



  • 禁用单个服务器如何影响整个基础架构的运行状况?
  • 是否可以预测基础设施的恶化?
  • 关键服务对系统有什么影响?

在本文中,我们将讨论Splunk如何帮助您找到这些问题的答案。

今天,我们将继续谈论Splunk系统的功能,专门用于收集实时日志数据,处理和执行复杂的搜索,实时数据分析以及创建动态仪表板和警报。

在之前的文章中,我们已经写过Splunk如何用于分析应用程序性能分析安全事件以及工业数据和物联网的方法

对于监视IT基础结构,这在以下情况下很有用:您的目标不是专注于当前正在运行的内容,而是了解发生故障或处于关键模式的情况,即各个服务是否存在性能损失。
从长远来看,许多问题可能会导致客户满意度下降,客户流失,员工时间损失以及由于设备停机而造成的组织金钱损失。 因此,重要的是要学习如何取得成功并在问题出现之前识别出问题。

通过监视IT基础结构可以解决的任务可以分为4个区域:

  1. 情境意识是定义什么有效以及需要解决的问题。
  2. 绩效和能力计划-随时间评估绩效指标的值及其对其他指标的依赖性,在此基础上可以获得绩效和能力的预测。
  3. 事件调查-对日志进行分析,您可以通过该日志恢复事件的全貌。
  4. 报告-创建实时更新的图形和报告。

让我们仔细看看Splunk可以为我们提供哪些监视基础结构的功能:

完全整合

在Splunk的帮助下,您可以完全集成所有系统,应用程序和附加组件,将看似无关的数据彼此结合。 设置主机并获取第一个日志和指标通常只需要很少的时间。



持续监控和关联

基于来自所有设备的数据的实时实时监控和相关指标,使您可以查看系统性能的完整图片,识别异常和问题的根本原因以及确定影响范围。





预测性

根据历史数据和复杂的KPI,您可以预测基础结构的运行状况,这可以防止系统出现故障。

过滤事件并减少调查时间

使用机器学习算法可以自动将事件数量减少到需要更多关注的事件。 事件的全面可见性和预测的构建将减少事件调查的时间,并减少事件和故障的总数。

可自定义的可视化和警报




能够创建各种报告和可视化的IT服务,关键指标和趋势的功能。 报告仪表板可以变化,并且可以针对不同类别的用户轻松自定义。 而且,还可以基于各种指标,一组指标或特定事件的值,配置警报以快速报告问题并尽快做出响应。



现成的解决方案


Splunk有几个现成的解决方案,使您可以快速实施对IT基础架构的监视。 这是Splunk基础架构见解www.splunk.com/en_us/software/splunk-enterprise/infrastructure-insights.html和Splunk IT服务智能(ITSI),我们已在前面进行了详细介绍。




Source: https://habr.com/ru/post/zh-CN421797/


All Articles