我们将继续本文,其目的是分享经验,并展示在IT基础架构和整个数据中心的电源子系统的设计和组织过程中发生的关键功能和常见错误。 但是,我想稍微扩大一下听众,将几个部分专门讨论确保电气安全和保护设备及人员的基本要素。
那些错过了第一部分或想记住第一部分的人
可以去这里 。
对于那些了解自动机和RCD的人,为什么需要它们,它们要受到什么保护以及保护什么-转到
IT设备,服务器,数据中心是否需要RCD? 。
第二部分
我们将看到能源与IT终端设备之间的关系是什么,我们将理解这个问题,在这种情况下,必须保证操作系统正常运行而不会出现故障。
备用交换问题信息设备的电源组织有冗余。 考虑--(不间断电源板-配电单元-电源)部分中的电源组织。 预订类型为以下类型:
- 使用单独的配电单元PDU冗余连接到机架,设备的电缆(图1)
- 电源面板中的电源总线冗余,使用独立的配电单元PDU(图2)
直接在服务器,交换机,IT设备中的电源级别的冗余(图3)
使用机架式负载开关,机架式ABP(SPN,又名ATS)进行冗余(图4)

要在主要输入和备用输入之间切换,可以使用:
- 在信息系统领域:用于高功率系统的机柜ABP / STS(静态转换开关),用于在功能完善的2N系统或N + 1系统组合运行时从备用UPS切换至电源;
- 在各种类型的ABP方案的电源系统领域(在接触器上,在控制器上);
- 在服务器机架级别:自动高速机架安装ABP \ ATS(Automatic TransferSwith);
- 在特定信息设备级别:重复的电源。
正如我们
在上面针对IT设备所述,“电源中断是不可接受的。” 在这句话下隐藏了什么? 信息设备功能的“突破”是什么? 现在,让我们看一个生动的例子。
客户在公司办公室的两层IT基础架构中实现了本地服务器机房。 在讨论电源系统的阶段,他想将所有信息设备放在一个电源单元(PSU)上,让第二个用于服务器PSU的插槽空闲,并在整个机架上安装一个机架式ATS。 (图4,图表)。
带有重复电源的服务器背面的外观
客户如何表达自己的愿望 :
- 节省成本(每个机架设备$ 500-800)
- 您可以放置两个最简单的PDU并已将它们应用于ATS之后的配电
- 与经典分配方法相比,系统可靠性绝对相同
我们进行了一次超时,从各种角度详细检查了客户的需求,一般的服务可靠性,保修期和保修期后,以及:
- 实施期间的资本成本成本(节省)(CAPEX)
- 折旧费,备件维护费,客户人员的人工费( OPEX )
- 比较两种情况下的操作算法和到备用线路的切换时间,检查“单点故障”
- 冻结和/或重新启动信息设备操作系统的风险级别,以及在其上运行的信息服务的下降。
结果是这样的:根据监管框架
GOST 32144-2013 (电能,技术设备的电磁兼容性。通用网络中的电能质量标准。引入日期-2014年7月1日),信息设备故障的主要原因可能是电压降,这可能是由于电压跌落造成的。
通常是由于电网或用户的电气装置中的故障以及连接强大的负载而发生的
继续阅读:
电压突降的持续时间最长为1分钟
这句话告诉我们,信息设备应该由UPS和/或高速ATS提供,因为从大功率的角度来看,这段持续时间的电压降是可以接受的并且是正常的,但对IT设备和服务却是致命的。
顺便说一句,值得注意的是,目前俄罗斯联邦现行监管框架在测量与电力质量有关的值方面存在矛盾,更多细节可以
在我们公司技术总监维克多·谢尔达克的文章中找到(
digitalsubstation.com来源)
文章摘录近年来,与CE相关的电能参数的测量领域中的国家标准已经被积极地开发并且已经被反复修订。

”
一个重要的变化是替换了GOST 13109-97“电能。 电磁兼容性。 符合GOST 32144-2013的通用电源系统中的电能质量标准[16]。 这些标准定义了不同范围的电能质量指标。
但是多快? 如何确定客户的服务(和服务器)不会下降并且操作系统不会出现“严重错误”的时间(以毫秒为单位)?

有一个CBEMA(计算机和商业设备制造商协会)标准,经过一些调整,现在被称为“ ITIC曲线”(信息技术行业委员会),其变体包含在IEEE 446 ANSI标准中。 根据这些标准,电源电子电路必须保持运行20 ms(或0.02秒,即一个周期)。
那些相同的ITIC曲线根据服务器和计算机系统
服务器系统基础结构的电源要求
,可以说在电压故障期间电源单元
Tvout_holdup的参数可确保信息设备至少运行21 ms。 即,整个网络周期是服务器或交换机保证的正常运行时间。 参数
Tpwok_holdup定义了至少20ms。
有关SSI参数的一些详细信息,请参见此处帮助:保持时间是电源在其输入端消失后可以将输出电压保持在一定范围内的时间。 在大多数计算机电源中,保持时间还可以表征电源正常信号(PWR_OK)告诉系统电源产生的电压不稳定的时间(对于计算机电源,此参数通常大于16 ms)。

这是文档中的表格之一

这是带有调节的BP运算算法的时间线图。
现在,让我们看一下APC声明的切换时间,例如,对于
AP7721品牌的机架安装式负载切换。 我们看到这里通常有8-12毫秒,但是18 ms是最大切换时间。
我们可以得出结论,机架负载开关切换到备用输入的时间与服务器设备电源单元的规格相对应。 事实证明,信息设备的运行不会有任何故障。
那么经济构成如何?哪个选项更有利可图且容错呢?
假设我们在机架中有三个小型服务器,您可以在其中放置两个电源和三个带冗余电源的设备。 一切都很关键,任何设备的故障都将导致整个客户系统整体故障。 无论如何,我们都需要一个机架式负载开关。 这大约是一万八千卢布。
客户声明他们不需要PDU(PDU),这意味着预算仅需花费ATS-相同的1.8万卢布。 客户建议使用机架安装负载开关的“板载”配电来代替配电单元(PDU)。 客户还计划购买一台服务器,该服务器带有两个用于供电的插槽,但是出于经济考虑,该服务器配置为一个PSU。
(图4)经典版本
(图3)涉及一组2个PDU-约32,000卢布,每台服务器3个额外的电源,每台500美元,总计8.4万卢布。 苯丙胺类兴奋剂相同的1.8万卢布。 综上所述,我们了解到经典解决方案将使客户花费
约13.4万卢布。看来是对的,客户是对的,金钱是完全不同的。 但是,让我们从两个选项的容错性和可维护性的角度来看:
客户选择: 单点故障 -机架式负载开关。 如果他发生了什么事,那么我们将失去整个机架。 因此,您需要在该站点上拥有备件,这估计会增加18,000卢布。 服务器中的电源一次只能供电一次,它们也是故障点。 因此,期望在现场具有至少一个,最好是所有三个电源备用。 让我们假设我们需要一个备件中的三个电源装置,这是另一个加36000卢布。 您需要检查机架式ATS可以切换的电源。 现在,我们从3 kW或16A足够用于机架的所有设备这一事实出发。 如果我们需要用于32A(7 kW)的ATS,那么它将更加昂贵(超过10万卢布)。 也就是说,客户选择的预算,加上对可靠性的详细考虑,
增加到16万卢布 。 在这种情况下,即使发生紧急情况,尽管现场会备有备件,但仍需要停机才能更换设备。
单点故障(SPOF)-数据可用性系统的节点,通信线路或对象,其故障可能会损坏整个系统或导致数据不可访问
开放技术选件 :
如图3所示 ,但如有必要,可为具有单个电源的小型网络设备添加ATS。
故障点是相同的ATS。 如果他发生了什么事,那么我们将失去整个机架。 我们同意您需要在现场保留备件。 但是在我们的情况下,如果只有ATS发生故障,那么这只会影响交换机和辅助设备的操作。 服务器本身将继续安静地工作。 不需要备件中的电源。 因为,如果重复的电源之一发生故障,则服务器将继续使用其余的电源,并且很可能它将等待供应商提供的新电源,而与站点的位置无关。
解释IT系统中的SPOF术语单点故障(SPOF)-节点,设备或电路点,其故障可能会禁用整个系统,从而导致数据和服务不可用。 在开发和设计任何关键系统时都考虑过。 完全没有单点故障会导致实施期间的资本成本显着增加,因此,特定系统或服务的关键性是在设计阶段根据项目预算以及客户的意愿和要求确定的。 我们始终为每个客户找到理想的解决方案,确定实施项目的几种选择,并将其提供给客户。 结果,在项目交付阶段,客户就可以准确地收到他希望在价格/质量/可靠性方面看到的解决方案。
因此,将所有机架设备连接到单个ATS是可能的,但不是合理的,因为在这种情况下,我们会遇到单点电源故障。 在任何情况下,最好都购买具有重复电源的服务器,因为信息设备级别的容错能力会大大提高。
机架式负载开关可确保正确,几乎瞬时地切换到备用输入,信息设备甚至不会感觉到它,软件产品和操作系统将继续正常运行。 在任何情况下,都需要机架安装式配电单元,无需节省任何费用。 配电资金成本的明显节省会导致无法解决的操作问题,例如,仅将ATS移至另一个单元或审核机架负载开关就需要“熄灭”整个机架。
无论如何,对于重复的电源,应该有备用零件,但是并不总是可能或可用的。可移动服务器电源的外观:

机架式ABP的使用具有其自身的特点例如,这种ATS的功率是有限的,并且就功率消耗而言,它可以由一组相对较弱的负载来切换。 关于输出电源连接器的数量存在疑问。 例如,上述ATS AP7721配备有C14型输入连接器,这意味着最大开关功率为2.5 kW。 为了获得更大的负载功率,有2U型号
AP7724 ,其输入端配备了32 A连接器,也就是说,设备的最大功率可以高达7 kW。 这意味着典型的设备机架可以完全连接到该ATS。 然而,这样一个决定的价格将超过10万卢布。
Vadim Sinitsky @dimskiy的
一篇文章很好地描述了具有两个电源的信息设备的工作。 如您所见,有优点和缺点。 而且在任何情况下都必须为信息设备提供冗余电源,尤其是在对象位于供应商快速供电区域之外的情况下。 此外,我们要注意,用于计算来自供应商的新服务器功能的在线计算器只能用作系统管理员和客户人员的指南。
应考虑电源的初始项目,机架网络,服务器,UPS,发电机的当前状态和负载,评估将新的功能强大的服务器连接到现有机架的实际可能性。 从机架中的连接角度来看,还值得考虑:
- 当前的PDU功能,例如其中的空闲插槽
- 机器在屏蔽层和横截面上的额定值以及到机架的电缆线的相位。
服务器电源系统的可靠性值得特别注意,如果它是按照
图2所示的系统(带有两个总线系统)构建的,则新的功能强大的服务器的存在会导致整个电源系统过载,以进行维修工作,并缩短电池上
UPS的电池寿命,使UPS开关绕过过载和更多...
以及如何建立机架分配系统?
用于IT设备的BP资源和用于其软件冗余的算法是什么?
您更喜欢使用哪个PDU:基本,受监控? PDU / PDU功能在实践中有多有用,它对您有帮助吗?作者:奥列格·库里科夫(Oleg Kulikov)
首席设计工程师
集成解决方案部
“开放技术”
okulikov@ot.ru
在国家专家登记册“ NOPRIZ”中注册P-045870