在这一年中,俄罗斯人定期放假-新年假期,5月和其他较短的周末。 这是连续马拉松,自发购买和销售Steam的传统时间。 在节前期间,零售和物流公司承受着越来越大的压力:人们在网上商店订购礼物,支付运费,购买旅行机票并进行交流。 日历峰值需求是对在线电影院,游戏门户,视频托管和流音乐服务的良好压力测试-它们都在假期期间正常工作。
我们以在线电影院Okko为例,说明如何组织内容的不间断可用性,该电影依赖于Linxdatacenter数据中心的功能。
早期,季节性设备购买了额外的设备以供本地安置,而且“有余地”。 但是,当Vremya Ch出现时,通常会发现公司无法或无法设法应对服务器和存储的正确配置。 它根本没有解决紧急情况发展过程中的这些问题。 随着时间的推移,人们逐渐了解:对内容和在线服务的需求高峰是在第三方资源的帮助下完美解决的,可以使用即付即用模式购买-实际消费量的付款。
如今,几乎所有预计在假期期间对其资源需求都会激增的公司(所谓的突发)都在预购通信信道带宽的扩展。 那些在数据中心资源上托管应用程序和数据库的公司可以提高云计算能力,以应对假期高峰,订购数据中心中必需的虚拟机,存储量等。
如何不错过计算

为了准备高峰负载,提供商和客户的协调工作非常重要。 这项工作的重点包括准确预测负载和数量方面的负载跳跃,精心计划以及与数据中心内同事以及与内容提供商方面的IT专家团队的交互质量。
许多解决方案可帮助组织必要的资源的快速分配,以使平板电脑屏幕上您喜欢的系列的新系列不会冻结。
- 首先,这些是工作负载平衡器:这些软件解决方案可以仔细监视服务器,存储和网络的负载级别,从而使您可以针对任务优化每个系统的性能。 平衡器评估硬件和虚拟机的可用性级别,一方面不降低系统性能,另一方面防止基础架构过热和变慢。 因此,支持一定程度的资源库存,可以将其快速转移到解决紧急任务(带有视频内容的门户的电话急剧增加,某种产品的订单增加等)。
- 其次,CDN。 该技术允许用户通过从最接近用户的地理位置访问门户来接收门户内容,而不会缓冲延迟。 此外,CDN消除了由于信道拥塞,通信断开,信道连接处的数据包丢失等对业务传输过程的有害影响。
无所不在的Okko
考虑使用我们在莫斯科和圣彼得堡的站点为在线电影院Okko假期做准备的示例。
Okko技术总监Alexei Golubev表示,除了日历假期(旺季)外,该公司还有一些主要的电影新奇作品问世的时期:
“每年假期期间,Okko的流量比上一年增长约两倍。 因此,如果在过去的新年季节中,最大峰值负载为80 Gb / s,那么在2018/19年,我们预计将达到160 -传统两倍。 但是,他们收到的速度超过200 Gbit / s!”
作为代号为“ New Year”的项目的一部分,Okko全年总是缓慢地为高峰负荷做准备。 以前,Okko使用自己的基础架构,该公司在自己的硬件和软件上拥有自己的内容分发分布集群。 在这一年中,Okko技术专家逐渐购买了新服务器,增加了群集的带宽,表明每年增长两倍。 此外,还连接了新的上行链路和运营商-除了Rostelecom,Megafon和MTS等大型运营商之外,它们还连接了流量交换点和最小的运营商。 这种方法使我们能够以最短的路线为最大数量的客户提供服务。
去年,在分析了设备成本,扩展的人工成本并将其与使用第三方CDN的成本进行比较之后,Okko意识到是时候尝试混合动力分配模型了。 春节假期期间,双倍增长的背后是交通流量的下降,而2月是最低的季节。 事实证明,他们的设备此时处于闲置状态。 到了夏天,下降趋势趋于平缓,到了秋季,新的上升趋势开始了。 因此,在为新的2019年做准备时,Okko采取了另一种方式:完成其软件的安装,以便不仅能够将负载分配给自己,而且还可以分配给外部CDN(内容交付网络)。 连接了两个这样的CDN,多余的流量合并到其中。 Okko的内部IT基础结构带宽已准备好维持相同的两倍增长,但为避免资源耗尽而准备了合作伙伴CDN。
“不增加CDN的决定为Okko节省了大约CAPEX发行预算的20%。 另外,该公司将安装设备的工作转移到了合作伙伴的肩膀上,从而节省了数个工作日。” -评论Alexey Golubev。
Okko的分布式集群(内部CDN)在莫斯科和圣彼得堡的两个Linxdatacenter站点中实现。 提供了内容及其缓存(分发节点)的完全镜像。 因此,莫斯科数据中心处理莫斯科和俄罗斯的几个地区,而圣彼得堡数据中心处理西北和该国其他地区。 平衡不仅发生在区域范围内,而且还取决于特定数据中心中节点的工作量,还考虑了高速缓存中电影的存在以及许多其他因素。
扩展的服务体系结构在图中如下所示:

从物理上讲,服务和产品开发支持包括在圣彼得堡的大约十个机架和在莫斯科的几个机架。 有几十个用于虚拟化的服务器和将近200个用于其他所有功能的“铁”服务器-分发,服务支持和自己的办公基础结构。 在峰值负载期间,内容提供商与数据中心的交互与当前工作没有任何不同。 所有通信仅限于支持应用程序,在紧急情况下(通过电话)。
今天,对于在线内容消费的100%不间断的情况,我们已经比现在更接近当前,因为为此所需的所有技术已经可用。 在线流媒体的发展非常快。 内容消费的法律模型越来越受欢迎:俄罗斯用户逐渐习惯于需要为内容付费的事实。 此外,不仅用于电影院,而且还用于网络上的音乐,书籍和教育材料。 在这方面,在线服务运营中最重要的标准是交付内容最丰富,网络等待时间最少的内容。 作为服务提供者,我们的任务是及时并有余地关闭资源需求。