独立数据中心验收



大家好! 我叫Cyril Shadsky,我是负责管理DataLine外部数据中心的部门主管。

本文专门介绍验收测试的最重要方面,以及可能使新手“测试人员”不胜其烦的可能出现的问题和陷阱。

因此,想象一下:一个满意的承包商将向我们报告四年的五年计划,没有问题,并且设施(数据中心或单独的大厅)已准备就绪。 看来现在是开始测试的时候了,但是...事实上,我们已经来晚了。 验收测试应至少在设计阶段进行计划。

第一个问题是将测试委托给谁? 当然是建设者! 毕竟,这比独立检查每个节点或雇用独立委员会要容易得多。 以防万一,我澄清:这是个玩笑。 如果一切都这么简单,那么就不会写这篇文章。

任何承包商都乐于验证他的建造物。 寻找自己的门框并将其隐藏在另一个位置非常好。

请记住:即使是最好,最受信任的承包商,也是一个有兴趣的人,他所藏的一切将来都会成为问题。 因此,请始终自己进行验收测试,或联系独立的组织。

如果您有经验并且测试不吓您,您可以自己进行。 我将尽力告诉您如何与我们安排验收测试以及我们在各个阶段遇到什么问题。

在数据线中,有一个基础建设局,负责建设新的大厅和数据中心。 建造后,所有这些便成为维护服务的责任。 对她而言,重要的是,一切都应以高品质建造。 我们的技术总监Sergey Mishchuk是公司这两个部门之间的“世界法官”。

尽管有我们所有的经验,但是每次测试时,我们都会发现各种各样的学校:严肃的和小型的。 这是绝对正常的。 您需要在测试过程中抓住它们,而不是等到它们变成问题为止。 这里有一些例子。

在99%的情况下,抱怨墙壁或房间之间存在密封孔。 这种情况是可以理解的:首先,您需要铺设SCS,电源线,氟利昂管道和其他管道,然后将密封推迟到最后一刻。 因此,请确保在开始测试之前确保它已完成。

我们必须进行一次生殖带泄漏。 所有数据中心场所均位于单独的受压区域,即“房屋内部”。


Hermozone顶视图

如果您的数据中心有隔离区,则必须用软管中的水将其丢弃,并确保没有泄漏。

垃圾无人逃脱。 在高架地板下,不可避免地会遇到工人遗忘的电缆切口,嵌齿轮,螺栓和其他锉刀。 无论我进行多少次检查,总会有评论。

如果您不强迫工人立即进行清理,那么当他们携带和安装设备时,一切都将保持躺着状态。 您觉得更容易些吗? 用工作架下的手电筒和清洁的建筑碎屑消除就位或汗水?

而所有这些只是冰山一角,这是对图片有一个总体了解的问题。 现在,我们将详细分析测试的每个阶段,并以“零标记”开始,即计划。

测试准备




在几乎每一篇文章中,我们都谈到了预先计划的重要性,而今天,我们也不会中断这一光荣的传统。 此外,计划应该是您进行测试的第一步(如果不是零的话)。

Uptime Institute建议您在数据中心的初步设计阶段开始计划并创建一个接受委员会,并且验证工作已经在设计阶段开始。

我们从项目的接受开始,没有它是没有办法的。 最好在设计阶段就接受施工。 请记住:固定“纸上”内容总是比已构建的对象容易。 在某些情况下,通常不可能“微调”完成的数据中心。

测试计划中还应包括以下几点:

  • 将进行哪些测试?
  • 什么时候进行测试?
  • 谁将接受测试?
  • 哪些公司员工会参与?
  • 需要什么工具和设备(电流钳,振动计,热像仪,风速计和许多其他晦涩但必要的东西)?

对于每个测试,我们都会编译要测试的系统列表,因为在不同的数据中心,每个单元都负责其设备。 在一个地方,我们将只检查电力和空调。 在其他系统中,可以向其添加其他系统,例如AUGP​​T,视频监视,ACS(与安全人员达成一致)。

我们特别注意建筑物本身。 通常,混凝土的品牌以及地板的浇筑方式不是我们的专长,而是我们需要检查活动地板,门,供水和污水处理系统

换句话说,在开始测试之前,您需要清楚地知道我们将进行什么测试以及在哪里进行测试,以避免重叠和混乱。

重要说明:检查此系统时,构建该系统的人员或另一位负责人员应在您附近。 适用于所有阶段。

通常,验收测试包括以下步骤:

  • 项目验证
  • 文件验证
  • 独立测试
  • 综合检查

我们将分别考虑它们。

文件核实




在任何情况下,您都不应跳过此阶段,甚至应跳过此阶段,并与独立测试并行进行。 即使时间不多了,您也必须确保每个设备和每个系统都与项目中声明的相对应。 如果不检查文档,您将无法定性地进行进一步的测试,更不用说问题的法律方面了。

待检查文档的完整列表是单独的,具体取决于您的配置。

我给出了在测试过程中需要检查的文档的示例:

  • 每个系统的执行文件;
  • 设备护照;
  • 技术启动法;
  • 测量和测试行为;
  • 测试压接系统的行为;
  • 有关测量接地回路和其他电缆通讯的电阻的实验室报告;
  • 设备安装说明。

仍然有操作文档。 它并不总是在施工合同中注明,如果不是,请向承包商寻求补充协议。 操作文档应包含说明和基本的切换算法,但是我们将在复杂测试的部分中返回此内容。

除了上述所有内容之外,我什至要说,确保编译负载表是非常可取的。 不幸的是,它们并非总是如此,但这是一个重要且方便的文档。

为什么需要它?

通常,数据中心的冗余由两条电源路径组成,并且您需要了解由于另一根光束完全断电而对一根光束施加的负载。

看来一个通用的方案已经足够了。 但是,对于您的专家来说,使用表格会更加方便。 不太可能错过或感到困惑。

当然,我们不能使每种行为与现实相协调,但是有必要确保所有行为都存在。

离线检查




自主检查是数据中心验收测试的下一步。 在这里,有必要手动检查每台设备:可操作性,设置,在最大负载下的操作,当然还有标记-如果没有标记,请执行以下操作:)标记必须与设计相匹配。 但是,与现实相吻合同样重要。


乙二醇电路标记示例

例如,对于配电系统,我们施加测试负载并物理上打开/关闭配电盘中的每台机器。 并且,从IT设备开始,我们依次浏览每个机架,制作一张桌子,并确保在关闭计算机时,也关闭了相应的硬件。

当然,有时在配电盘中会神奇地出现不在项目中的机器。 没关系,主要的是负载不会超出标准,并且在文档中对此进行了说明。


右总机

对于空调,柴油发电机组和UPS等设备,我们执行简单的独立检查:开/关,运行模式,设置等。 奇怪的是,检查设备的固定状况很重要。 我们遇到过这样的情况,即可以用一根手指拧下重要的螺母。

第一轮结束了,我们给安装者时间来纠正缺陷,然后我们返回,第二步一切都进行了。

他们说,在工人中间,他们称他们为不断下地狱的圈子-在第二次检查中,我们经常发现以前从未注意到的门框。 然后它开始:“你不是马上说什么?”

您可以理解别人,但与我们在一起,就像电影《当心汽车》中一样:您正在追赶,而我正在逃跑。 相反,您消除了,但我发现了。

在扰流器下,列出了我们执行的最重要的自动测试。
冷却方式:
  • 目视检查设备是否符合安装手册的要求;
  • 验证管道固定,管道隔离及其连接的可靠性;
  • 检查电气设备在配电盘(自动机,电磁起动器,接触块)中紧固的可靠性;
  • 检查控制面板的可操作性;
  • 检查硬件软件的运行算法:在模拟事故后从工作切换到备份;按时间检查轮换(如果有)。

电源:
  • 目视检查设备,核实是否符合安装手册的要求;
  • 用单线图检查系统及其组件的符合性;
  • 选择性的非接触式温度测量(带有检查位置的指示)。

DGU:
  • 检查控制面板;
  • 检查灯光和声音指示的正确操作;
  • 在自动和手动模式下检查柴油发电机组测试启动过程中的问题;
  • 在30%的设计负荷下检查柴油发电机组6小时的性能。

UPS:
  • 当电池放电到最大允许水平时检查UPS自动启动,检查电池寿命(在设计负载的100%时工作);
  • 在100%负载下运行期间验证UPS的主要参数;
  • 在100%设计负载下运行时,以自动和手动模式在旁路模式下验证UPS输出。


当一切正常运行时,独立测试已完成,最有趣的部分开始了:全面测试。

综合测试




让我在这里进行题外话,讨论一下什么是数据中心以及什么对其功能至关重要。

首先,数据中心是一个单一系统,几乎是活着的生物。 总体而言,他的“健康”取决于他所有器官之间的相互作用。

例如,空调经常告诉我们:“您不喜欢什么? 看,它吹着吹凉! 一切都应该做到!”

DGU的专家对此表示赞同:“看,一切开始,甚至通电!” 通常,每台设备都运行良好(我们在自主测试中对其进行了检查),但只能靠它自己进行。 值得一起开始所有事情,并且系统崩溃了。 它是为了识别与设备的联合操作相关的问题,因此要进行全面检查。

测试范围可能取决于冗余级别:系统之间的互连程度越高,您需要检查和调试的工作选项就越多。

例如,如果我们正在构建Tier III数据中心,则必须安全关闭基础结构的每个元素,包括电缆和配电路线,以进行更换或维修。 因此,必要测试的数量正在增加。 当数据中心在负载下运行时,我们始终会关闭/禁用各种设备。 一个系统的变化绝不会导致相邻系统的故障。

重要说明1:所有综合测试均在负载下进行。 在99%的情况下,热风枪直接放置在机房中,并且数据中心被“烧毁”-这就是我们检查工程系统质量的方式。

重要说明之二: DGU是数据中心的主要电源。 这个城市是另一个“廉价”来源,因此我们对柴油进行所有复杂的检查。

任何数据中心的关键系统之一是主配电盘和柴油发电机组中的自动化。 必须非常仔细地检查该系统。 标准门框-如果关闭城市输入,则不会过渡到DGU。 这是因为有些人安装了DGU,而另一些人则安装了自动化设备,而设备却无法配合在一起。

调试系统后,值得准备一个设置表并规定ATS的算法。 如果您遇到一个非常好并且负责任的承包商(设计师,建筑商),他们可以独立记录所有内容,那就更好了。 否则,请不要懒惰,自己写下以下几点:

  1. 在几秒钟后启动柴油发电机的命令到达;
  2. 几秒钟后,将过渡到DGU;
  3. 第1款和第2款相反。

在扰流器下,我们和Uptime Institute使用的其中一项检查的示例算法。
  1. 我们进行从城市网络到DGU组的过渡,测量指标。
  2. 我们回来。
  3. 完全关闭其中一台柴油发电机组(关闭通信,自动机),并观察系统如何在没有备用柴油机的情况下启动。 这可能会导致与错误的自动化设置相关的问题。
  4. 检查柴油发电机后,我们将继续对其进行操作并进行剩余的功率测试。
  5. 我们关闭一台UPS,观察负载如何传递到另一根光束。 我们转换为旁路,反之亦然,将电池放电。
  6. 我们将继续坚持该计划,并关闭配电盘。


然后检查空调系统。 我们会依次关闭空调,如果它们具有集成的ABP系统,我们也会对其进行检查。

如果将空调配置为成组工作,并自动从备用模式切换到主模式,请确保检查其工作方式。

  • 删除所有连接;
  • 重新启动负责切换的控制器;
  • 关闭连接空调的配电开关;
  • 测试自动化-在这里经常崩溃;
  • 我们正在做所有可能写在小说“数据中心的50种阴影”中的事情。

对于乙二醇系统,必须通过关闭泵并关闭热交换器之一和路线的一个或多个部分来检查液压系统。


在这里您可以看到每个盾牌均已标记并提供了简短说明

重要提示:如果手动进行切换,则承包商必须提供算法。 阀门和闩锁的标记应指示操作位置(常开,常闭)。

承包商经常说:这不在提供的测试计划中。 您可以回答此问题:不提供事故计划:)

偶尔也会发生这种情况。 例如,在测试UPS期间,一台邪恶的空调可能会运转起来排放:

“你希律王在做什么?!” 你为什么要关掉水泵?
-我们没有关闭任何东西,我们正在测试UPS。
-为什么要强奸冷却器? 他们会打破!
-这就是为什么我们正在努力寻找如此狭窄的时刻。

另一个频繁的测试是检查灭火系统。 为此,我们将所有自动化装置从液压缸上断开,并测试指示如何工作。 发生方向混乱的情况,打开/关闭无效。

不要忘了监视系统(我们在这里这里详细介绍了它)。 一旦启用或禁用某些功能,此更改必须出现在面板上。 我们还将检查监视是否开始由于大量警报而变得“愚蠢”。

确保测试监视电源。 在任何情况下,在任何紧急情况下都不会失去对数据中心的控制。

我们一切都是由建设者完成的


一开始,我写道,验收测试应由外部专家进行。 但是有些事情应该直接向承包商收取。 这是开关设备的演示(以及其他一些工作)。 接收方附带一份清单,并写下结果。 像这样:

  • : « №34. , , , ».
  • .
  • .

.





, - — . , ( 50-100 ).

  • 3-5 .
  • 3-5 , . , .
  • 2-3 , .

, . , 2-3 . .

, — . , — . . , , .

,




.

. , . , , — . , 10 .

: « , , !». , , . . .

, , , . .

, ? , . , .

, , . — , .

: , , , . « », , IT-, . — , .

- , .

Source: https://habr.com/ru/post/zh-CN421547/


All Articles