数据仓库性能:新数字

在之前的文章中,我们分享了针对Meltdown和Spectre漏洞安装补丁后对虚拟机监控程序性能的评估。 今天,该讨论数据仓库性能了。

由于VzKernel的优化和使用“ Retpoline”选项的重新编译,我们替换了易受攻击的机器代码序列,并且几乎可以完全消除由于需要保护虚拟机管理程序免受Intel处理器漏洞而导致的性能问题。 结果,生产率的降低减少到1-2%。 但是,在这种背景下,许多人对数据仓库的操作有疑问。 这并不奇怪,因为在超融合环境中,分布式数据存储起着根本性的作用,而随着存储速度的降低,虚拟机和容器的所有性能优势都将消失。

今天,我们想与您分享两项演示测试,这些演示测试是评估Virtuozzo 7产品系列中内置的VZ Storage分布式存储中的虚拟机性能和数据密度的,使用6个节点的群集作为测试平台,直接存储数据其中只有5个被占用,在其余节点上找到了虚拟机。

每个节点具有以下配置:

  • CPU:2个Intel Xeon E5-2620 v4 @ 2.1 GHz
  • 内存:64 GB DDR4 2133 MHz
  • NET:2 x 10 Gb / s-两个单独的子网以分开测试流量和分布式数据存储流量
  • 容量:

    • 硬盘:8 x 1 TB 7200 RPM-包括用于块服务器(CS)的7个硬盘
    • SSD:400 GB Intel DC P3600 PCIe-用于元数据(MDS),日记和客户端缓存

每个节点上的一个磁盘已分配给系统,其余7个磁盘已分配给块服务器(CS)进行数据存储。 结果,该集群变成了42个块服务器。 为了管理这种经济,我们推出了3个元数据服务器(MDS)。 数据复制是根据3:2方案实现的,可以将其视为大多数典型任务的标准解决方案。

根据WebBench测试的结果,我们评估了Windows Server 2012 R2虚拟机的性能和密度,VZ7中对虚拟存储的请求数量要高得多,并且总体性能比VZ6随附的上一代存储的结果高30%。 。 同时,VZ Storage与Virtuozzo 7虚拟机管理程序一起可以支持在此大小的群集上同时运行100多个虚拟机,从而为它们提供可接受的性能。

WebBench:基于VStorage的Density VM Windows 2012 R2


第二项测试是使用SysBench实用程序执行的,它不是模拟OLTP请求,而是模拟OLTP事务。 我们在同一群集上使用Microsoft Windows Server 2012 R2加载了相同的虚拟机,并获得了更有趣的结果。 除了从30个虚拟机开始的性能优势之外,VZ7还显示了更高的分发密度,可以同时运行100多个虚拟机。 同时,VZ6上过时的存储在精简群集上最多显示60个虚拟机,显示出可接受的性能。

SysBench:基于VStorage的Windows 2012 R2 VM密度




关于擦除编码的更多信息


除了上述所有内容外,Virtuozzo仍然是使用基于Reed-Solomon或Erasure编码的压缩技术的支持者。 尽管对该技术进行了广泛的讨论,但许多人仍然更喜欢使用直接副本并在其网络上存储多达3个数据副本。 但是,如实践所示,此方法会降低网络性能并减慢备份过程。

为了验证这一事实,我们组装了两个群集,每个群集6个节点。 两个集群都启动了3个元数据服务器(MDS)和66个块服务器(CS),用于通过SAS 15K驱动器存储数据。 其中一个群集用于托管虚拟机,另一个用于备份。 我们尝试了两种放置备份的方式:EC处于3 + 2模式(两个散列值用于三个数据)和3:2完整备份(两个完整数据副本存储在网络上)。 从数据保护的角度来看,这些配置是相同的-即使发生两个故障点,它们也可以恢复所有信息。 但是,就性能而言,EC显示出更好的结果。

并行VM备份脚本中的擦除编码和数据复制



横坐标表示同时参与备份过程的虚拟机的数量。 沿着纵坐标轴的是平均备份速度,单位为MB / s。 计算每个节点的速度,因此总吞吐量和群集性能要高得多,是节点数的倍数。 该图显示,在每个节点上同时备份15个虚拟机的情况下,由于使用EC而导致的性能提升为10%。

结论


这些测试显示了在使用MS Windows虚拟机时更新的体系结构和改进的VZ存储操作的优势,传统上,与使用来宾Linux的VM(通常可以转换为系统容器)的VM相比,传统上更难以优化和压缩。 在此测试中,我们使用SAS 15K硬盘驱动器,而不是固态驱动器,由于总响应时间和存储子系统速度的增加,其结果会更高。

Source: https://habr.com/ru/post/zh-CN413713/


All Articles