本文前面已经介绍了计算“可用性系数”的方法论的理论和要点。
在本出版物中,我们将计算两组电信级网络设备的“可用性因子”,每套都安装在一个电信机柜中,并与没有重复元素的一组设备的“可用性因子”的计算结果进行比较。
为什么需要针对不同的设备配置案例进行“可用性因子”计算?
我们在最终结果中计算“可用性系数”的数据可能不正确,太理想,太高和太低。 在那里错误蔓延或者正确地计算了所有错误,您只有在可以一起查看系统的所有元素,使用选项和位置的情况下才能理解。
“可用性因子”的“理想”计算示例。网络设备套件1的主要组件:
- 思科ASR 9010-2个;
- Cisco ASR 9000v-2个;
- 电源“ 48V”配电盘-10-2-2个。
思科ASR 9010设备完整性:

已安装套件号为1的机柜图如下所示:

第一组设备的可用性因子的计算:

(*)-MTBF参数的初始数据是为制造商的这些设备或其类似物提供的估计值。
Cisco ASR 9000系列路由器设计为具有较高的平均故障间隔时间(MTBF)和较低的平均解决时间(MTTR)速率,从而提供了一个可靠的平台,可将停机或停机时间降至最低,并最大限度地提高可用性。 MTBF是根据地面良性条件计算得出的。 可以根据不同的路由器使用情况来调整值。编号1的最终计算数据:
- 一年中系统设备发生故障的可能性:0,0008023;
- MTBF设备系统(年):1246(10918609小时);
- 平均故障排除时间(小时):24;
- 系统设备可用性系数(%):99.99978;
- 每年平均停机时间(小时):0.019(1.15分钟)。
在计算中错误地考虑了什么?
要计算可用性因子,您需要了解设备的安装方式和位置,功能是什么以及元素的热交换和复制的可能性,安装和更换组件的复杂性,而无需断开组合系统的主要系统。
在理想的计算中,所有元素都是重复的(这种情况很少发生),假定备有备件,我们可以在附近的工作设备上进行现场作业而不会出现问题。
而且,如果物理布局与系统的逻辑方案有所不同,则此处的系统各个部分将无法相互复制。
在“理想”情况下,我们有两个彼此重复的半部分的复合体。 但是,如果没有这样的逻辑重复,那么我们已经从“理想”计算转向了更正确的计算,并且得出了合理的结果。
现实一点,每年将60分钟添加到“重新启动\关机程序”中。 从您按下机箱上的电源开关开始,下载新机箱,配置并以正常模式运行应该足够了。 对于60分钟的停机时间,每年发生故障的概率为0.04167。 这将是下面计算的底线。
“可用性因子”的“实际”计算示例。不重复计算第1套设备的可用性因子:

1号组的最终计算数据,无重复:
- 年内系统设备故障的可能性:0,5001666;
- MTBF设备系统(年):1.99(17514小时);
- 平均故障排除时间(小时):24;
- 系统设备可用性因子(%):99.86;
- 每年平均停机时间(小时):11.98(719分钟)。
上面执行的两个计算之间的差异很大。 而这一刻必须始终被记住和分析。
在最好的情况下,即使我们在系统中有重复的元素,如果这些元素包含其他组件,您也需要忽略它们作为替换所涉及的可能性。 也就是说,我们看起来我们有两个机箱和两个电源板。 这些组件是重复的,但它们内部还有其他元素,当“母亲”组件出现故障时,它们可能会停止运行。
如果这对于机箱是必不可少的,那么对于屏蔽罩来说就没有什么问题了,因为只有简单的电子设备才用于测试和电流负载显示,即使该板出现故障,屏蔽罩也会正常工作。
“可用性因子”的“标准”计算示例。网络设备集2的主要组件:
- 思科ASR 9006-2个;
- Cisco ASR 9000v-2个;
- 电源“ 48V”配电盘-48-5-2个。
思科ASR 9006设备完整性:

安装了2号套件的机柜图如下所示:

考虑到机箱和电源面板不重复,计算第2套设备的可用性因子:

第2组的最终计算数据:
- 该年度系统设备故障的可能性:0.2167769;
- MTBF设备系统(年):4.7(40410小时);
- 平均故障排除时间(小时):24;
- 系统设备可用性系数(%):99.94;
- 每年平均停机时间(小时):5.2(311分钟)。
事实证明,在计算可用性因子时,有必要了解即使在24小时内也可以更换系统中的哪个最大元件。 以及替换多少元素会影响其余组件的功能。
例如,当更换机箱时,我们将不得不从该机箱上拆下整套板卡和适配器,这可能要花费一些时间和2-3个小时以上。 而且,当设备在机架旁边打开时要拆除这些元件,这会带来额外的紧急情况。
对于理想的选择-两个带有设备的机柜,每个带有2个机箱-一个工作,第二个空以便快速激活,并从故障中转移元素。 但这是一个非常理想的情况。