我们正在测试SharxBase,这是俄罗斯供应商SharxDC的软件和硬件虚拟化平台

今天,我将讨论SharxBase超融合平台。 哈布雷(Habré)上没有对这一复杂事件进行审查,因此决定结束这种不公正现象。 我们的团队设法在“战斗中”测试了该解决方案,结果如下。

图片

PS:削减后有很多桌子,实数和其他“肉”。 对于那些沉浸在精华中的人-欢迎光临!

关于商品


SharxBase平台基于Intel制造的服务器以及OpenNebula和StorPool开源软件。 它以盒装解决方案的形式出现,其中包括具有预安装虚拟化功能的服务器硬件和分布式存储软件。

可以订购四种基本标准配置(小,中,大,存储),它们的可用计算资源(处理器,RAM)和磁盘空间的数量不同。 服务器被设计为模块:一个典型的2RU机箱,最多可容纳四台服务器,以安装在标准的19英寸服务器机架中。该平台通过增加节点数来支持水平扩展,并通过增加节点中的RAM数量来支持垂直扩展。 ,安装其他驱动器和扩展卡。我们目前支持网络适配器,启动控制模块和NVMe驱动器的安装。

储存架构


为了组织分布式容错存储闪存驱动器(SSD和/或NVMe)。 使用的介质是以太网。 要传输存储存储,需要使用专用的网络接口-至少两个25 GbE接口。 提供分布式存储的服务在群集中的每个服务器上工作,并使用其部分计算资源。 资源量取决于安装的驱动器的数量和数量,平均而言,每个主机的开销为34 GB RAM。 通过iSCSI块访问协议连接到分布式存储。 为了确保容错能力,支持两次或三次数据备份。 对于生产性安装,制造商建议使用三重冗余。 当前,从存储优化技术开始,仅支持精简配置。 不支持使用分布式存储的重复数据删除和数据压缩。 将来的版本将支持擦除编码。

虚拟化


要启动虚拟机(VM),请使用KVM管理程序。 支持其创建和管理的所有基本功能:

  • 从头开始创建VM,并指示所需的硬件配置(处理器核心,RAM大小,虚拟磁盘的数量和大小,网络适配器的数量等);
  • 从现有或模板克隆虚拟机;
  • 创建即时快照(快照),删除快照,回滚从创建快照以来对VM所做的更改;
  • 更改先前创建的VM的硬件配置,包括为包含的VM连接或断开虚拟磁盘或网络适配器(热插拔/热拔插);
  • 虚拟服务器之间的VM迁移
  • 监视VM的状态,包括监视计算资源和虚拟磁盘的负载(当前大小,以MB / s或IOPS为单位的I / O量);
  • 根据计划(启动,关闭,创建快照等)计划对VM的操作;
  • 通过Web控制台通过VNC或SPICE协议连接和管理VM。

图片
典型框图(4个节点)

平台管理是从图形界面或命令行(通过SSH连接时本地或远程)以及公共API执行的。

在虚拟化平台的局限性中,可以注意到缺乏在群集主机之间自动平衡VM的机制。

除了支持服务器虚拟化之外,SharxBase还具有创建软件配置的数据中心和私有云基础架构的能力。 作为此类功能的示例,可以注意到:

  • 基于组和访问控制列表(ACL)中的用户成员资格来管理访问权限:可以将权限分配给限制对虚拟基础架构组件的访问的不同用户组;
  • 资源消耗核算(accounting):处理器,RAM,磁盘资源;
  • 根据所消耗的资源及其价格,以任意单位估算计算资源的消耗成本(Showback);
  • IPAM(IP地址管理)的基本功能:在预定范围内自动为VM网络接口分配IP地址;
  • SDN的基本功能:创建虚拟路由器以在虚拟网络之间传输流量。

使用开发的信息安全模块,SharxBase采取了其他措施来确保平台管理系统的信息安全:用户帐户密码的可自定义要求(复杂性,长度,使用期限,可重复性等),阻止用户,管理控制台当前访问会话,注册事件和其他事件该软件被输入到俄语软件注册簿中(编号4445)。 从测试实验室收到了关于在FSTEC RF认证系统中成功完成SharxBase软件的认证测试的肯定结论,该测试用于监视NDV的缺失的第4级,并且符合GIS等级1 / ISPD安全等级(包括在内)的技术规范(满足保护虚拟化环境的要求)。 预计将在2018年12月获得符合信息安全认证系统要求的证书,即ROSS RU.0001.01BI00号(俄罗斯联邦FSTEC)。

下表中提供了对该功能的详细说明。

监控方式


SharxBase Monitoring提供对高级平台状态信息,警报设置和平台状态分析的访问。
监视子系统是一个分布式系统,安装在每个群集节点上,并向虚拟化管理系统提供有关平台状态的数据。

实时监视子系统收集有关平台资源的信息,例如:

服务器节点电源供应器开关虚拟机分布式数据仓库
-单元序列号
-节点和主板的序列号
-单位和单位温度
-CPU型号和负载
-插槽号,频率,RAM的大小和可用性
-节点和存储地址
-冷却风扇的转速
-网络适配器状态
-网络适配器序列号
-磁盘的状态及其系统信息
-电源序列号
-电源状况及其负载
-开关型号
-交换机及其端口的状态
-冷却风扇的转速
-冷却风扇的状态
-显示VLAN列表
-CPU负载
-RAM负载
-网络负载
-虚拟机状态
-磁盘读写速度
-传入/传出连接速度
-显示可用空间
-磁盘状态
-使用的磁盘空间
-驱动器错误

小计


该解决方案的优势包括:

  • 有可能交付制裁名单上的组织;
  • 该解决方案基于OpenNebula项目,该项目已经开发了很长时间。
  • 支持有关服务器虚拟化的所有必要功能,足以用于中小型安装(最多128台主机);
  • 信息安全模块的存在,可确保信息安全领域中法规要求的实施。

该解决方案的缺点包括:

  • 与市场上其他HCI解决方案(例如Dell VxRail,Nutanix)相比,功能较低;
  • 备份系统的支持有限(当前已宣布Veritas NetBackup支持);
  • 有些管理任务是从控制台执行的,无法通过Web访问。

功能性


图片
图片
图片
图片

在扩展超融合解决方案的产品组合时,我们与供应商一起进行了性能和容错性测试。

性能测试


测试平台是Intel HNS2600TP服务器的4节点集群。 所有服务器的配置都是相同的。 这些服务器具有以下硬件特征:

  • 服务器型号-Intel HNS2600TP;
  • 两个Intel Xeon E5-2650 v4处理器(12个内核,时钟频率为2.2 GHz,支持超线程);
  • 256 GB的RAM(224 GB的内存可用于运行VM);
  • 具有2个QSFP +端口的网络适配器,数据传输速率为40 Gb / s;
  • 1个RAID控制器LSI SAS3008;
  • 6个SATA SSD驱动器,每个Intel DC S3700容量为800 GB;
  • 两个额定功率分别为1600 W的电源。
  • 服务器上已安装SharxBase v1.5虚拟化软件。

所有连接到Mellanox网络交换机的服务器。 连接图如图所示。

图片
测试台上服务器的连接图

功能测试的结果证实了先前描述的所有功能。

磁盘子系统的测试是使用Vdbench软件5.04.06版进行的。 在每个物理服务器上,使用具有8个vCPU,16 GB RAM的Linux OS创建了一个VM。 为了在每个VM上进行测试,创建了8个100 GB的虚拟磁盘。

在测试期间,检查了以下类型的负载:

  • (备份)0%随机,100%读取,64 KB块大小,1个出色的IO;
  • (还原)0%随机,100%写,64 KB块大小,1个未完成IO;
  • (典型值)100%随机,70%读取,4 KB块大小,4个出色的IO;
  • (VDI)100%随机,20%读取,4 KB块大小,8个出色IO;
  • (OLTP)100%随机,70%读取,8 KB块大小,4个出色的IO。

下表中列出了这些类型的测试结果:

图片
图片
图片
该存储在顺序读取和写入操作分别为8295.71 MB和2966.16 MB方面提供了特别高性能的指示器。 在典型负载(具有70%读取的4KB块的随机I / O)下的存储性能达到133977.94 IOPS,平均I / O延迟为1.91 ms,并且随着写入操作与读取操作的比率增加而降低。

容错测试


通过这些测试,可以验证系统组件之一的故障不会导致整个系统关闭。
测验测试细节留言
存储池中的磁盘故障14:00-系统正常运行;
14:11-禁用服务器1中的第一个SSD;
14:12-SSD故障显示在平台管理控制台中;
14:21-禁用服务器2中的第一个SSD;
14:35-平台管理控制台中显示了两个SSD的故障;
14:38-将驱动器返回服务器1和2。SSD上的LED指示灯不显示;
14:40-工程师通过CLI执行了将SSD添加到存储库的操作;
14:50-在平台管理控制台中显示为正在工作;
15:00-VM组件同步完成;
系统正常运行。 容错指示器如前所述。
网络故障15:02-系统正常运行;
15:17-禁用两个服务器1端口之一;
15:17-Web控制台的IP地址(隔离的服务器充当领导者)的一个Echo请求丢失,该服务器上运行的VM可通过网络访问;
15:18-禁用服务器1上的第二个端口,VM和服务器管理控制台不可用;
15:20-VM在服务器3节点上重新启动;
15:26-服务器1的网络接口已连接,服务器返回到群集;
15:35-VM磁盘组件的同步完成;
系统正常运行。
一台物理服务器故障15:35-系统正常运行;
15:36-通过IPMI界面中的poweroff命令关闭服务器3;
15:38-测试VM在服务器1上重新启动;
15:40-包含服务器3;
15:43-服务器操作已恢复;
15:47-同步完成。
系统正常运行。

测试结果


SharxBase平台可在任何一个主要硬件组件出现故障的情况下提供高度的可用性和容错能力。 由于磁盘子系统具有三重冗余,因此该平台可确保在出现双重故障的情况下数据的可用性和安全性。

该平台的缺点包括:由于需要存储和同步三个完整数据副本而导致对磁盘空间的高要求,以及缺乏用于更有效磁盘空间利用率的机制,例如重复数据删除,压缩或擦除编码。

根据所有测试的结果,我们可以得出结论,SharxBase超融合平台能够为各种类型的负载(包括OLTP系统,VDI和基础结构服务)提供高水平的可用性和性能。

伊利亚·库金(Ilya Kuykin),
领先的计算机系统设计工程师,
喷气信息系统

Source: https://habr.com/ru/post/zh-CN429042/


All Articles