为您的项目选择数据中心仍然很痛苦。 如果您知道搜索时要查找的内容,则为您的任务找到最佳的数据中心会更加容易。 对于Playkey云游戏平台,流质量直接取决于数据中心:其可靠性,与用户的接近程度,网络质量和其他参数。 因此,我们每天与数据中心合作,我们知道它们的主要主要问题。

在此出版物中,Playkey CTO Alexey Lykov将告诉您如何选择数据中心,搜索时要记住的内容,为什么要研究电源的功能以及欧洲数据中心与俄罗斯数据中心的区别。 我们把地板传给阿列克谢。
1.了解层级数据中心标准
选择数据中心时的第一个问题是可靠性或正常运行时间。 此参数最受欢迎的认证是Uptime Institute方法,该方法将所有数据中心分为四个等级(Tier)。 根据TIA 942标准,还有另一种系统可以评估数据中心的可靠性,但是由于其建议性质,它对我们而言并不那么有趣。 对于Uptime Institute证书,他们自己会在多个阶段(从设计施工文档到对中心的运营服务进行定期评估)验证DC,并根据审核结果进行评估。 为DC获得这种“伪造”证书几乎是不可能的。
以下是这四个层级的简要说明:
- 第1层 。 工程基础架构,没有冗余和冗余资源。 每年的停机时间为28.8小时。 容错率为99.671%。
- 第2层 。 该系统没有完全冗余,但是配备了额外的冷却和电源设备。 每年停机时间-22.0小时。 回弹率-99.749%。
- 第3层 。 数据中心具有多个用于配电和冷却的通道以及冗余组件。 每年的停机时间为1.6小时。 容错率为99.982%。
- 第4层 。 具有双重冗余的数据中心,至少要考虑一个附加组件。 冗余组件2(N +1)的几种主动负载分配和冷却方式,即 2个UPS,每个冗余N + 1个。 TIER IV级数据中心一年的停机时间不超过24分钟,故障转移率为99.995%。
这里是所有经过认证的Uptime Institute数据中心的地图,但它们在俄罗斯的位置。 只有26件,并且全部都在该国的欧洲地区:

地图上的蓝色标记是唯一经最高TIER IV标准认证的俄罗斯数据中心,它不在莫斯科,而是在萨兰斯克。 这是从内部看的样子:

照片清楚地显示了可移动的活动地板,其布置大致如下:

根据Uptime Institute对数据中心可用性级别的分类,TIER IV可完全保留系数为2N +1的所有工程系统,从而可以在不中断数据中心服务的情况下进行任何维修工作。
这是Saransk数据中心具有独立电力输入的电源系统的外观:

根据官方数据 ,Mordovia的数据中心应成为电子政务基础设施的中心单元,但它也可以应付银行,保险公司甚至军方的任务。
各种层级的要求有时似乎有些混乱(例如,需要为DC的员工和来宾提供一个单独的停车场),但在大多数情况下它们是足够的。 因此,要求根据Tier 3标准的DC拥有场所。 显然,如果数据中心建在租用的位置,那么建筑物的所有者可以随时提出任何建议,无论罚款是多少,他都会提高价格或完全违反合同。 如果您看到具有Tier 3证书或更高级别证书的站点,则将排除此风险。 就我们自己而言,我们选择与不低于Tier 2的数据中心合作,并且我们在德国的欧洲数据中心已通过Tier 3级别认证。
DC租了一个高楼层的房间,而电梯属于其他人,这是一个奇怪的情况,因此,在周末和晚上都关闭了电梯,因此启动设备存在问题。
2.指定数据中心的电源和冷却参数
如果使用非标准服务器配置,则可以安全地将第二项与第一项相提并论。 我们始终特别关注服务器的电源和散热,因为我们使用的不是普通的GPU服务器,而是大多数数据中心都不打算使用的GPU服务器。
如果我们采用42个单位的标准服务器机架,则通常看起来像这样(不包括笔记本电脑):

通常,数据中心所有者将7-10千瓦的功率带到这样的机架上,并放置适当的冷却装置。 对于具有约300-500瓦的典型服务器功耗(包括 各种存储系统,交换设备,配线架等。 但是在我们的情况下,只有GPU服务器中的视频卡“消耗”了150瓦至250瓦,并且在一台设备上最多使用了8个这些视频卡。 结果,GPU服务器的总功耗约为2千瓦。
因此,我们只能在一个机架中放置3-4台服务器,即 6-8个单元,如果我们要谈论2个单元服务器。 结果,在服务器机架中,我们只能占用8个单元,而34个单元将是免费的。 这就提出了空间效率的问题。 并提高我们的租金价格。
结论呢? 如果您对设备有异常的要求,那么值得为您这样的客户寻找一个(至少部分地)完善的数据中心。 在我们的案例中,对于具有GPU服务器的客户,机架提供大量电源并增强了散热。 但是,到目前为止,此类客户端(和数据中心)的数量很少。
3.根据用户的位置选择一个位置
听起来很老套,但是值得记住的是,您的研发或总部所在地不一定是数据中心的所在地。 主要-大多数服务用户所在的位置。 在Playkey,开发办公室位于彼尔姆(Perm),一开始我们还与当地的彼尔姆(Perm)数据中心合作,简化了设置并使其可以快速解决数据中心的任何问题。 但是,当用户群开始快速增长,并且其主要部分(在那些从事俄罗斯游戏的用户中)仍然来自莫斯科时,我们决定也将中心的所有服务器分组。
资本转移到莫斯科数据中心后,我们立即看到了通信质量的改善和参与者的积极反馈。
4.提前寻找管理联系和“测试”技术支持
快速的技术支持和适当的管理是数据中心工作的另一个关键点。 尝试阐明数据中心员工的一些典型任务,例如,根据BIOS指令进行配置,然后查看响应。 如果您被派往另一位专家或开始对答案慢下来-所有这些都不是最好的迹象。 请记住,如果服务器发生严重问题,那么在没有物理状态的情况下,通常不会解决该问题。 和技术支持-遇到任何严重问题时,您的“双手”。
关于数据中心的管理,请记住,如果没有“决策者”的联系,任何协调工作都将耗时数日。 如果直到签合同之前您都没有遇到,直到最后一个在数据中心实际做出决定的人为止,最好寻找托管服务器的替代平台。

5.检查数据中心所有者的法人实体
最短,但同样重要的一点。 不要太懒惰以“突破” nalog.ru上的法人实体。 查看登记簿的摘录-您将了解公司成立了多长时间,管理层和所有者变更的频率。 并且在仲裁案件的数据库中,不要忘记查看她的法院案件。
6.如果您正在与欧洲DC合作-请耐心等待
欧洲数据中心的心态及其工作安排与俄罗斯严重不同。 根据我们与欧洲数据中心合作的经验,我们可以肯定地说,他们做事的速度较慢。 如果在俄罗斯,技术支持人员可以迅速解决服务器设置方面的几乎所有问题,那么在欧洲,这并不是那么简单。 他们始终将内部员工划分为从事低级和高级任务的人员。 官僚机器迫使客户证明问题确实很重要,并且需要数据中心的“高级”专家立即介入。 准备详细描述您提出上诉的原因,等待审批,然后才希望获得帮助。
工作方法有所不同。 例如,在俄罗斯,几乎所有对数据中心的请求都可以通过聊天或信件发送,并迅速收到响应。 当我们与德国和英国的数据中心员工合作时,我们只能通过电话进行通信。 怎么了 只是他们习惯如此。
这种细微差别使欧洲人变得更加慢。 值得一提的是,我们自己来自俄罗斯,而且我们更容易与讲俄语的人互动,但我认为,即使不考虑这一点,“我们”的程序也可以组织得更好,工作也更快。
我们现在已经开始为进入美国市场做准备,因此对我们来说,所有要点都不是空洞的。 在各州的情况下,我们离数据中心的距离将不会是三个小时,而且时区也会有很大的差异。 因此,我们将全权负责选择长期合作伙伴。 云服务提供商将是一个快速启动的优势,因为在过去的一年中,两家大型服务公司已经推出了使用GPU租用服务器的功能。
对于想要检查我们数据中心质量的用户,我们准备了下一个促销代码PlaykeyGeekSummer,用于游戏720分钟。 它自激活之日起有效期为四天,仅适用于新用户,并且直到2017年7月31日都不要忘记激活它。