防止数据中心火灾或如何存储数据



6月5日,在Borovaya的Dataline数据中心发生了轰动性大火之后,我们接到了相关客户的大量电话。 每个人都在担心一个问题:“我应该为最坏的情况做准备吗?” 尽管Cloud4Y与OST数据中心无关,但我们还是决定讨论此类事件的特征。 什么真正威胁到客户数据,以及云提供商如何解决确保服务器平稳运行的问题。

数据中心(数据中心)或数据中心是建筑物,结构或房屋,其中安装了服务器和网络设备,旨在处理,存储和传播信息。 数据中心专为在高负载下连续运行而设计,因此必须避免任何紧急情况。 如果他“飞行”,那么使用该公司服务的公司所遭受的经济和声誉损失可能至关重要。

任何简单的事情,甚至一秒钟,都可能导致其服务失败,不仅与业务流程有关,而且与人员安全有关。 因此,对数据中心的主要要求是两个:容错能力和运营成本。

正确设计的消防安全系统是容错的重要组成部分,这就是为什么数据中心会花费大量资金来改善它。 它有帮助-数据中心火灾极少发生,在特殊情况下用户数据完全遭受损失。

为什么要刻录数据中心


起火的主要原因:

  • 处所设计的质量;
  • 负责消防安全和与电工一起工作的人员的资格;
  • 组织基础设施监测;
  • 工程系统维护的及时性。

您需要了解,一个好的现代数据中心是一个大面积的区域,到处都是数千米的电缆,并且到处都是电子设备(柜子,机架),设备和功耗很高。 所有这些设备在运行过程中都会发热,因此是潜在的着火源。 不要忘记带有燃料供应的UPS或DDIBP,以及数据中心着火的外部原因:雷电,洪水和人为因素。

但是,实践表明,火灾实际上实际上并不是直接在数据中心的受保护场所内发生的,那里的保护级别很高。 数据中心中安装了灵敏的火灾探测器,并组合成一个通用的火灾预警和灭火系统。 还必须有一条法规,据此可以执行一系列组织措施,包括对设备进行持续的目视检查,验证是否符合消防标准和电气设备的运行规则。

来自德国的独立火灾风险专家Christoph Kainz甚至认为 ,在大约80%的情况下,数据中心火灾的起因在于IT设备在户外。 他的经验表明,发生火灾的原因是机房与相邻机房的分隔差,这些机房的消防系统薄弱以及其中的火力高。

显然,数据中心在消防安全方面投入了大量资金,因此直接在机架上发生火灾的情况极为罕见。 因此,用户数据通常保持完整。

消防中心场景




数据中心发生火灾有三种方案。 对于每种工具,都使用严格定义的检测工具,这些工具对于这种情况特别有效。

方案1:阴燃(导线或微电路) 。 排放的烟雾以最小的浓度存在于空气中。 在此阶段,火灾将能够检测到抽吸系统,以便及早发现火灾。 由于对电子设备的损坏通常不是由火焰引起的,而是由在阴燃和燃烧过程中释放的气体造成的,该气体会氧化电子触点。

解决方案 :现代数据中心使用内置在早期火灾探测系统中的气体分析仪。

方案2:机架空间中浓烟 。 烟雾通过安装在机架内部的常规烟雾探测器进行检测。 它们发送的信号由安装在数据中心的服务器硬件监视程序处理。

解决方案 :传感器用作监视特定设备所有系统的附加信息源。 有时-启动单独的机架灭火系统。

方案3:数据中心冒浓烟 。 由于安装在数据中心内部的通用火灾报警系统的可寻址或不可寻址传感器而被检测到。 当发现火灾时,充当中央控制面板的防火面板会自动启动活动的灭火系统。

解决方案 :灭火过程已经覆盖了整个数据中心空间。 根据场所的特性,使用不同的灭火物质。

我们再次强调,电缆绝缘层的燃烧产物会严重损坏电子设备。 当从1千克PVC中点燃时,释放出数百升烟道气,其中包括氯化氢HCl。 后者与周围的大气发生反应,被合成为盐酸,从而导致电触点腐蚀甚至后者闭合。 不用说,必须尽快发现并消除此类过程?

因此,例如在核电站中,不可燃的电缆产品( STO SRO-S 60542960 00030-2014STO 1.1.1.01.001.0902-2013 )具有绝缘层和护套在阴燃期间不散发腐蚀性气体的聚合物组合物。 在数据中心,GOST 31565-2012“电缆产品。 “消防安全要求”,它定义了在燃烧和衰减过程中不散发腐蚀性气体产物的电缆产物的类型。

不能使用用于扑灭机架上的火灾的洒水喷头和雨淋系统,因为如果触发这些系统,昂贵的设备将被淹没,并造成无法修复的损坏。 但是那该扔什么呢?

如何扑灭数据中心




如果无法通过其他方式阻止火灾的发生,例如通过关闭吸烟服务器或空调系统,自动灭火系统将开始工作。 正如我们已经说过的,如果触发不正确的灭火装置,则可能造成与火灾本身相当甚至超过的伤害。 因此,您需要考虑以下因素来选择安装:

  • 人员,设备和环境的安全;
  • 经济效率;
  • 每种情况下OTV灭火的寿命和有效性;
  • 所需的放置区域(灭火装置占用的空间越少越好);
  • 能够创建简化的管道。

目前,还没有这种方法可以熄灭满足所有这些要求的服务器。 因此,在为数据中心配备设备时,可以从五种主要方法中选择一种或几种方法来消除火灾:

缺氧法


该方法的本质是通过创建和维持不会发生火灾的气氛来扑灭火灾。 将氮气引入房间,这会将氧气含量降低到14%以下。 氮气是由特殊的发生器不断从大气中产生的。 在这种环境下,不会发生火灾并蔓延,与此同时,这种氧气水平足以在服务器机房中工作。

除一个成本外,低氧方法在所有方面都优于其他灭火方法。 并非每个公司都有能力花这么多钱扑灭大火。

隔离度


一种有效的方法,适用于“氧取代”原理。 向着火的房间提供干净的惰性气体或灭火混合物。 氧气含量降至14%以下,火焰熄灭。 使用氮气,氩气,氩气或惰性气体。 在这些缺点中,可以再次指出对人类有害的化学反应的可能性。

抑制作用


一种涉及活性中心结合的方法,该方法导致燃烧连锁反应的终止。 如果更简单,则将卤化气体注入室内,从而抑制火焰中的化学反应,抑制活性中心(自由基和具有自由价的原子粒子),从而干扰燃烧过程。 氯酮(氟化烃)通常用作抑制剂。 最近, Novec 1230物质(称为“干水”)也开始流行。

请注意,在抑制作用的化学反应过程中,可能会分离出可能对人造成危险的副产物,并且还会在被保护的设备上留下斑块。

冷却方式


消灭服务器机房的最年轻方法之一是在欧洲广泛使用,例如荷兰的TCN Eemsdelta和Telecity IV,马来西亚的CX2 Cyber​​jaya研究和技术站点等数据中心。 发生火灾时,将水雾喷洒到燃烧区域(细分散的细水喷流),这会导致局部水平的氧气含量下降,并冷却了火区。 蒸馏水用作水,可以使容量高达10 kW的电气设备熄灭。

这种方法比洒水系统使用的水少90%,消除了日常模式下的管道流,并且在为系统加油时价格便宜。 但是您还需要提及该系统的高昂成本。 它涉及使用一个到几个泵站来保持管道中的恒定压力,这也有严格的技术要求。 部分由于这个原因,这种方法并未在俄罗斯数据中心中广泛使用。 我们一直不信任水作为电气设备的灭火剂。 即使是分散很细的水也可能凝结成水滴,因此在一个地方或另一个地方会被潮湿,这在服务器机房中是不可接受的。

粉末/气雾剂


数据中心中最不常见的淬灭方法。 点燃后,释放粉末化学物质并喷雾气溶胶。 热燃烧物体表面上的粉末和气溶胶均会形成一层防止氧气渗透的薄膜,从而降低了重新点燃的可能性。 在服务器机房中,这将成为一个问题,因为粉末和气溶胶会渗透到任何设备中,并沉淀在内部部件上,这些部件无法防止侵蚀性物质的侵害。 熄灭后,由于腐蚀和电路短路的发生,设备将逐渐失效。

顺便说一下,粉末灭火系统通常安装在变压器和DDIBP中,而传统的洒水系统则用于办公场所,走廊和公共区域。

哪种消防解决方案最有效?


通常, 气体灭火方法现在是明显的领导者。 气体不会损害电气设备,即使在狭窄的空间内也能发挥出色的作用。 还值得考虑的事实是,数据中心的服务器机房在运行过程中不会一直有人在场,并且在设备运行(通电)时进行灭火。 由于气体装置的紧凑性,它们可以针对特定的保护对象进行缩放,支持的温度范围为-40至+55°C,从而保护了模块化和容器(移动)数据中心。

气体灭火系统可以根据两个原则进行组织:

  • 机架 。 暴露在单独的机架上。 它用于带有专用设备的车厢,尤其是如果存储在该处的数据丢失所花费的费用比气体灭火系统的安装和操作还要多。 系统的运行使您不会中断安装在其他机架中的设备的运行。 当数据中心的机架由其他公司租用时,这很方便:其中一个机架发生火灾不会导致其他服务器关闭。
  • 常见的 。 该系统执行在受保护数据中心的整个区域内检测和扑灭火源的功能。 这种系统由干线和分配管道,用于释放气体的喷嘴,用于检测火灾的传感器,控制控制器以及具有灭火成分的气瓶组组成。 它可以由不同制造商的组件组装而成。

在大多数情况下,现代消防设施中使用以下气体:

  • 氟利昂125HP 。 其作用基于抑制作用,很少使用稀释原理。 在灭火过程中,由于气体的化学分解,释放出大量有害化合物。
  • 氟利昂227 。 它还基于抑制作用起作用,在化学水平上停止燃烧过程并吸收热量。 灭火还释放出许多有害物质。
  • Inergen 。 使用这种物质进行灭火是基于稀释机制,即 通过降低室内的氧气浓度(空气排量)而发生。 Inergen的特征是释放后气相中的物质显着膨胀,从而大大降低了室内温度。
  • Novec 1230 。 由于从燃烧链反应中选择了热能,这种气体产生了冷却效果。 同时,受保护房间的温度也略有降低(不超过2-3度)。

仅在对受保护对象进行分析之后才能选择“正确的”灭火剂。

最著名的“火灾受害者”




2010/03/27
在“未来技术”的数据中心发生火灾。 结果,服务器遭受了大火和用来扑灭大火的水的折磨。 一天多以来,大约有2500万个站点被禁用。 放置托管服务提供商host.ua,ostia.ru,onelim.net,provisov.net,imhoster.net,alekshost.ru,onlinehoster.net,xlhost.ru。 令人惊讶的是,数据中心中安装了最先进的灭火系统之一,由于手动禁用,该系统无法正常工作。 她经常被错误触发,并且数据中心员工将她拒之门外。 结果,消防员不得不灭火。 损失估计达数千万美元。 这次火灾是创建更好的探测器的动力,并且是重写不止一项关于消防安全的内部指令的场合。

11/05/2010
星期五早上,在杜塞尔多夫ERGO保险集团的新计算中心发生火灾时,有28人受伤。 20名员工因严重一氧化碳中毒住院。 没有关于用户数据问题的报告。

2012年7月6日
在微软的家乡西雅图,大型数据中心的电源系统发生了火灾,导致新的Microsoft Bing搜索引擎中的搜索功能失败。 用户数据不再受到影响。

2014年4月20日
位于韩国果川市的三星SDS数据中心大楼发生火灾,导致全球智能手机,平板电脑和智能电视出现故障。 同时,Samsung.com网站离线。 数据中心的停机时间持续了几个小时,此后大多数用户再次获得了对设备功能的完全访问权限。 Samsung.com也已在线返回。

2015年2月10日
丹麦一家大型商业公司袭击了袭击者。 攻击者向公司办公室放火,大部分建筑物中仅剩煤。 服务器场被大火包围,在60分钟之内摧毁了其边界以外的所有东西-包括外部房间中的电源和电信电缆。 当时服务器机房的外墙太热了,消防部门决定在门上钻一个洞,看看里面是否有火。 当房间终于开放时,所有的IT设备都是安全无害的。 发生火灾时,极高的温度启动了模块化数据中心的灭火系统,该系统向房间内注入了惰性气体(氮,氩和二氧化碳的混合物)。 压力平衡阀允许多余的气体排出以消除多余的压力。 同时,一小团烟雾落入房间,由于墙壁上出现了几个黑点。 部署新的电源基础结构和网络电缆后,将重新启动设备。 最终,重新启动服务器场花了大约三天的时间。

2015/06/30
英国最大的运营商之一BT Group的数据中心内一间装有电信设备的房间发生大火,这使贝尔法斯特(英国)的整个数据中心瘫痪,并使包括政府机构在内的众多公司客户无法使用通讯和Internet。 Tibus(服务提供商)和Translink(从事公共交通),贝尔法斯特市议会,北爱尔兰电力(能源公司)尤其受到影响。 引起大火的原因,公司未报告。

2015年11月24日
巴库首都达美电信数据中心发生火灾,阿塞拜疆用户无法使用互联网。 停机持续了八个小时,影响了78%的阿塞拜疆网络。 我们谈论的是超过600个网络,这些网络使用了Delta Telecom和Telecom Italia Sparkle之间的一个关键连接。 发生此事件后,仅可以使用本地移动运营商Backcell和Azerfon的渠道来访问Internet服务。 由于将国家与外部流量交换节点连接的网络数量较少,因此出现了Internet问题。 当前,许多邻国,例如伊朗,格鲁吉亚,亚美尼亚和沙特阿拉伯,也存在类似情况。

2016年8月17日
由于负责为政府的IT基础设施提供服务的加拿大国家组织加拿大共享服务公司的数据中心冒烟,几个部门无法以正常模式向北美州公民提供服务。 该事件引发了政府网站和工资系统的大规模关闭。 此外,用于政府官员的内部电子邮件服务器已脱机。 据加拿大媒体报道,白天约有50,000名公共服务人员无法接收和发送电子邮件。 市区也受到停机时间的影响。

2016/03/16
在圣彼得堡的Selectel数据中心着火。 在施工期间发生点火。 火灾蔓延到办公场所上方建筑物的屋顶和立面。 由于火灾,这条街被封锁了,但是客户数据没有受到影响。

03/06/2018
在巴西南部州阿雷格里港市南里奥格兰德州,数据中心BRDigital发生了火灾,该公司是CommCorp集团公司的一部分。 消防员到达现场后,疏散了人员,并为城市中心的一栋13层高的建筑物断电。 不久,大火被扑灭,并被扑灭,警察封锁了该建筑物,并计划于周三进行检查。 遭受大火袭击的位于这栋大楼中的公司仅在3月9日(星期五)才恢复活动。 该数据中心的一位客户Rafael Azeved写道:“数据中心中存在的唯一灭火系统是厨房灭火器。” 如果有兴趣,请查看以下其中一台服务器的最后几分钟的历史记录:

[15:22 pm] - IPMI: 0
[15:23 pm] - IPMI: 1
[15:24 pm] - BCM
[15:25 pm] - IPMI: 0
[15:25 pm] - IPMI: 1
[15:25 pm] - IPMI: 2
[15:25 pm] - IPMI: 3
[15:25 pm] - IPMI:
[15:26 pm] - IPMI:
[15:26 pm] - IPMI: > 180
[15:26 pm] - IPMI: BCM


2019/06/05
OST数据中心的大火导致Mail.ru的工作中断。 要使其熄灭,我必须断开大多数主要邮件服务器的连接。 对Down Detector服务的投诉中,有80%具体与Mail.ru的不可访问性有关;在16%中,Mail.ru网站根本没有打开。 QIWI是受害者之一,其数据中心也位于大楼内。 他们花了大约30分钟的时间将所有操作切换到备份系统,并恢复了正常的付款处理方式。 据称,用户数据未受到火灾的影响。

结论


为了存储客户数据,我们使用俄罗斯和欧洲的数据中心网络通过了Tier 3可靠性级别认证,如何确保该级别的数据中心的防火安全:

  • 安装了自动消防系统。 它由3个子系统(气体,粉末,洒水器)组成,可保护100%的对象区域;
  • 在数据中心的电气安装中,使用耐火绝缘的铜电缆;
  • 全天候对此类数据中心基础架构组件进行监控;
  • 已安装了早期烟雾探测抽吸系统(VESDA);
  • 使用了现代的自动火灾报警系统,显示出最少的误报。
  • 可以同时扑灭两个房间的火灾。

第3层可靠性级别的数据中心的容错级别为99.982%。 这不仅可以通过复制系统来实现,而且可以通过深思熟虑的确保消防安全的理念来实现。 在此类数据中心中存储数据确实是安全的。 试试看吗?

Source: https://habr.com/ru/post/zh-CN456414/


All Articles