数据中心现代化的三个故事

哈Ha! 今年是我们第一个OST-1数据中心推出十周年。 在这段时间里,来自运营和基础建设服务部门的同事们设法对数据中心的工程基础设施进行了不止一次的现代化。 今天,我将告诉您最有趣的情况。



一台200吨的起重机将新的Stulz冷却器安装到机架上。 2015年对OST-1数据中心系统的冷却系统进行了现代化改造。

数据中心是一个生命有机体,它在成长,变化,崩溃:)可以归因于现代化的一切,我有条件地分享:

  • 预定的更换和维修。 设备已过时,使用寿命到期。 我们会在方便的时候(例如,对UPS的“内部”进行全面升级或更换用完的电池)不加仓促地进行预算,计划和进行此类工作。
  • 设计错误 。 根据正常运行时间的规定,所有内容都应同时花费并结束。 由于设计不当,可能会违反“冷-电-位”的平衡,例如:有放置机架的地方,但大厅不再受到电力或空调的牵引。 这些错误最令人不快的是,它们不会立即弹出,而是在数据中心达到其设计能力时弹出。
  • 意外 发生设备完全,不可挽回和意外损坏的情况,因此需要进行更换。

我不会谈论计划的更换/维修。 在那里,几乎一切都在我们的掌控之中。 我将告诉您有关设计错误和崩溃后升级的三个故事。

历史1.机舱没有足够的寒冷


这是一个关于我们在Borovaya的第一个大厅的故事。 他还在工作。 设计容量为80机架的5 kW大厅。

大厅里满满的时候,寒冷不再足够了:寒冷走廊的温度超过了必要的温度,局部过热不断出现。 直到后来,根据我们的经验,我们意识到我们在设计中犯了错误,因此,空调遭受了损失。

失误
问题
一排长长的架子-连续超过20个
行中间停滞热风
低天花板-长达3米
没有足够的空间进行正确的空气交换。 有局部过热的区域
低层活动地板,下方有许多通讯装置
高架地板下冷空气流通的干扰



该行太长,几乎看不到另一端的空调。 2009年照片。

那时我们没有看到这些问题带来的任何“神奇药丸”,因此我们决定分阶段,全面地采取行动。

首先,我们检查了所有设备的安装是否正确以及插头是否在空闲状态。 我们还仔细检查了多孔砖的布局,并去除了多余的砖,在活动地板下安装了额外的导风板。 我们试图找到并密封所有可能逸出冷气的孔。 我还建议您检查一下空调和墙壁之间的物品。 5-7厘米的间隙已经很大。


这是我们得到的结果,它为存根提供了简单的免费单元。

它变好了,但还不够好。 然后,我们决定隔离寒冷的走廊。 他们建造了一个屋顶,聚碳酸酯制成的门。 原来便宜又开朗。 结果,我们消除了冷热空气的寄生混合物,提高了冷气供应系统的效率。


同一大厅的隔离冷走廊。

我们知道这足够一会儿。 随着IT工作负载的增加,电力不足将再次使人感到不适。

他们试图通过添加氟利昂空调来解决这个问题,尽管该大厅致力于乙二醇冷却。 我们非常关心空调的尺寸(它将穿过门,是否有足够的转向角度),因此我们选择了具有部分拆卸可能性的模型。 空调不是像通常那样从热走廊的侧面安装,而是在可以挤压的地方安装。 这为我们增加了80千瓦的冷却能力。


这是同样的“ gutta-percha”空调艾默生。

整个故事变得很复杂:必须弄清楚如何将氟利昂履带带到外部设备,如何为这些空调器通电,在哪里放置外部空调器。 所有这些都在工作室里。


只是为了了解有多少空间。

经过所有这些操作后,我们摆脱了局部过热的局面,温度在冷热走廊中均匀分布。 事实证明,这增加了大厅的容量,并在其中放置了声明的五千瓦机架。

这个故事的寓意是,您不应该害怕一步一步地解决问题。 就其本身而言,每个动作似乎(然后在我们看来)都是无效的,但是总的来说,这是一个结果。

历史2.机舱中的空调和电源耗尽


一个客户房间设计用于100个5 kW的机架。 设计机架宽度为800毫米,每排10个机架。 然后,客户改变主意打进来,大厅被普遍租出。 在生活中,网络设备主要需要宽度为800毫米的机架,而其他所有设备则需要百分之六十。 结果,我们得到的是13个,而不是连续10个机架,仍然有空间。 但是电和冷还不够。

在现代化过程中,分配了一个新房间,用于另外两个300 kW UPS。



大厅中出现了其他配电板。



新电源需要均匀分配。 为了分离新旧梁,在活动地板下铺设了单独的电缆桥架。 通过交替切换每个功率束,将部分可用的IT设备切换到新的配电盘。

为了解决冷气不足的问题,我们每100 kW冷气增加1台空调。



在所有设备的装配,安装和调试过程中,大厅继续正常运行。 这是项目中最困难的时刻。

现代化的结果是,我们为另外30个5 kW的机架增加了一个电和冷室。


设计能力和大厅容量增加了30%。

历史记录3.关于更换冷却器


有点背景。 一切始于2010年,当时OST数据中心的3台冷却器在飓风中严重受损 。 然后,为了生存,有必要在没有保护的情况下驱动冷却器几天,然后压缩机迅速弯曲。 最初,它们已更改。

随着数据中心变满,IT负载也随之增加,而Emicon制冷机未达到声明的制冷能力。 2012年,他们在同一液压回路中安装了另一台Hiref冷却器。 所以我们又住了三年。

随着时间的流逝,Emicon制冷机加剧了运行问题。 他们的力量还不够,所以在加热时必须从Karcher倒水。 多年以来,热交换器中长满了钙质沉积物。 由于热交换器的特殊结构而无法清除的白杨绒毛和其他杂物填补了自然冷却热交换器和氟利昂冷凝器之间的缝隙。 一个真正的毡靴在那里形成,它不能让空气正常通过。

2015年,我们刚刚为NORD-4购买了一批Stulz冷水机。 我们决定更换此业务下的三个Emicon制冷机中的两个。 现在了解详细信息。

在不重新安装泵的情况下安装其他Hiref冷却器。 IT负载不断增加,受飓风影响的冷水机组效率正在下降。 在夏天,保护区仅够了。 我们决定添加另一个冷却器以增加其总容量。 在工作期间,冷却系统应继续运行。 该操作中最困难的部分是乙二醇回路的组织。 我们进行了乙二醇捆扎:从每个冷却器中将一个乙二醇环分配给一个新的冷却器。 冷却器一一停运,乙二醇管被带到新的冷却器上。


液压系统概念的片段。 它显示了从三个冷却器中的每一个都分支到新的冷却器。

该冷水机组的主要任务是在夏季支持冷却系统。 感谢Hiref,在炎热的月份里我们保证有N +1的储备。 但是在飓风中损坏的冷却器逐渐开始变干,我们不得不考虑更换它们。


相同的“夏季” Hiref冷水机。

用Stulz替换Emicon。 最好在秋季或春季进行此类更换:在没有保护区的夏季,这完全是令人恐惧的,而在冬季,进行此工作实在令人不快。 该手术计划于2月/ 3月进行,但准备工作于10月开始。

在准备的几个月中,我们铺设了新电缆,对管道进行了熟化,制定了使用设备接近机器的计划(我们有一个紧凑的后院),并清理了起重机可以进入的区域。 必须在工作中的数据中心更换冷却器,大约1.5天后,他没有备用冷却器。 在准备阶段,我们进行了测试以了解数据中心在没有储备的情况下的感觉,发明了在工作中可能出问题的各种情况(例如,更换冷水机的长时间停电),并制定了行动计划。 这是这些作品的简要编年史。
一台冷水机在晚上到达。 成功将起重机检入数据中心区域后,就可以开始关闭旧的冷却器了。


正在进行准备工作时,旧冷水机仍在使用中。 我们为新的冷水机做饭。

然后,应该将装有冷水机的汽车开到附近的工作地点。 温和地说,我们在那里有些拥挤。 我不得不出汗才能在有限的空间内适应所有这些复杂的转弯。





拆下冷却器,将其锯成两半。



新旧冷却器的尺寸不同。 准备金属框架花费了更多时间。 仍然可以抬起并安装冷却器。



在背景图中,照片显示新冷却器的乙二醇回路部分正在并行添加。





安装后,所有液压装置均安装在机架上,冷却器已连接至电源。 晚上进行压接。 第二天,进行调试并连接到监视系统。

不到两天的时间就可以完成操作:早上关闭了旧冷水机,第二天结束时又打开了新冷水机。

两周后,更换了第二台冷却机。 看来您只需要按照经过验证的方案进行所有操作,但是出了点问题。 整夜都在下雪。 首先,我不得不花时间清理区域,以便起重机可以呼入。 我们开始拆除旧的冷水机,因为距我们两百米处的一辆汽车与新的冷水机发生故障。 不能返回的点已经过去,拖车车轮的货车(来自控制面板的货车)在货车上损坏了。

它没有在现场解决,我们去了另外一个遥控器,这个遥控器在周六奇迹般地出现在该公司的办公室里。 使用遥控器,我设法使汽车旋转。 结果,我们花了3个多小时才完成一个回合。 有了所有的后勤保障,这项工作一直持续到深夜。 我们考虑在黑暗中工作照明是一件好事。 其余工作照常进行,从星期一在数据中心开始,另一个新的冷却器开始工作。

今年三月,我的同事更换了第三台冷风机,这是飓风中幸存的最后一批。 现在Borova拥有3台Stulz制冷机和1台Hiref。 由于分阶段进行了现代化改造,我们现在有大量的冷气供应,而且我们不惧怕最热的天气和白杨蓬松。 新型冷水机在更宽的温度范围内支持冷冻模式,消耗的能量更少,并且运行非常安静。 由于压缩机室是分开的,它们的维护也非常方便:维修时无需完全停止冷却器。

Source: https://habr.com/ru/post/zh-CN431434/


All Articles