使用无共享架构降低停机风险

数据存储系统中的容错性主题始终是相关的,因为在我们无处不在的虚拟化和存储资源整合的世纪中,存储是其链接不仅会导致普通事故,而且会导致服务长时间停机的链接。 因此,现代存储系统包含许多重复的组件(直至控制器)。 但是这样的保护足够了吗?




绝对所有列出存储系统特性的供应商,总是提到其解决方案的高容错能力,而必须添加“没有单点故障”这一术语。 仔细研究典型的存储系统。 为了消除服务停机时间,电源,冷却模块,I / O端口,驱动器(意味着RAID)以及控制器(当然是控制器)在存储系统中是重复的。 如果仔细研究此体系结构,您将注意到至少两个潜在的故障点,这些点对于以下内容略微保持沉默:


  1. 单个背板(背板)的存在
  2. 一份数据

Backplein是一种技术复杂的设备,必须在生产中进行严格的测试。 因此,在极少数情况下会完全失败。 但是,即使在部分故障(例如驱动器插槽无法正常工作)的情况下,也必须通过完全关闭存储系统来替换它。


乍一看,创建数据的多个副本也不是问题。 因此,例如,存储系统中的“克隆”功能相当广泛,它允许以一定的周期更新数据的完整副本。 但是,如果同一底板有问题,则副本将与原始副本一样不可访问。


克服这些缺点的一个完全显而易见的解决方案是复制到另一个存储系统。 如果我们对预期的硬件成本翻番视而不见(尽管如此,我们假设选择这种解决方案的人已经事先充分考虑并接受了这一事实),以许可证,额外的软件和硬件的形式组织复制仍然会有可能的费用。 最重要的是-您需要以某种方式确保复制数据的一致性。 即 构建存储虚拟器/ vSAN /等,这也需要大量现金和时间资源。


AccelStor在创建其高可用性系统时着手摆脱上述缺点。 因此,对“无共享”技术有了一种解释,即免费翻译的意思是“不使用通用设备”。


无共享架构的概念是使用两个独立的节点(控制器),每个节点都有自己的数据集。 在节点之间,通过InfiniBand 56G接口进行的同步复制对于在存储系统顶部运行的软件而言绝对透明。 结果,不需要使用存储虚拟器,软件代理等。


从物理上讲,AccelStor两种解决方案可以通过两种模型来实现:


  • H510-基于2U封装中的Twin服务器,如果需要适度的性能和最大22TB的容量;
  • H710-基于单独的2U服务器,如果需要高性能和高容量(最高57TB)。


H510双服务器型号



基于单独服务器的H710模型


使用不同外形尺寸的原因是需要不同数量的SSD才能达到给定的体积和性能。 另外,Twin平台更便宜,并且允许您提供更实惠的解决方案,尽管以单个背板的形式存在一些有条件的“缺点”。 两种模式的其他所有内容,包括操作原理,都完全相同。


每个节点的数据集具有两个FlexiRemap组,外加2个热备用。 每个组都能够承受一个SSD的故障。 根据意识形态, FlexiRemap将所有传入请求重新构建,以将节点记录到具有4KB块的顺序链中,然后以最方便的方式将其写入SSD(顺序记录)。 此外,主机仅在将数据物理放置在SSD上后(即,在 无需在RAM中缓存。 结果是令人印象深刻的性能,高达600K IOPS的写入性能和1M + IOPS的读取性能(型号H710)。


如前所述,数据集同步通过具有高带宽和低延迟的InfiniBand 56G接口实时进行。 为了在传输小数据包时最大限度地利用通信信道。 因为 只有一个通信通道;为了进行额外的脉冲检查,使用了专用的1GbE链路。 仅通过它传送心跳,因此对速度特性没有要求。


如果由于扩展架而导致系统容量增加(高达400 + TB) 它们也将成对连接,以符合“无单点故障”的概念。


为了提供额外的数据保护(除了AccelStor已经拥有两个副本的事实),在任何SSD发生故障的情况下,将使用特殊的行为算法。 如果SSD发生故障,则节点将开始在其中一个热备用驱动器上重建数据。 处于降级状态的FlexiRemap组将进入只读模式。 这样做是为了消除对备份磁盘的写入和重建操作的干扰,从而最终加快了恢复过程并减少了系统可能受到攻击的时间。 重建完成后,节点将切换回普通读写模式。



当然,与其他系统一样,在重建期间,整体性能会下降(毕竟,FlexiRemap组之一在记录时不起作用)。 但是恢复过程本身要尽可能快,这将AccelStor系统与其他供应商的解决方案区分开来。


Nothing Shared技术的另一个有用功能是节点在所谓的“真主动-主动”模式下的操作。 与“经典”架构不同,在“经典”架构中,只有一个控制器拥有特定的卷/池,而第二个控制器仅执行输入/输出操作,在AccelStor系统中,每个节点都使用自己的数据集,并且不会将请求传输到“邻居”。 结果,由于节点对输入/输出请求的并行处理以及对驱动器的访问,整体系统性能得以提高。 另外,实际上不存在故障转移之类的事情,因为在发生故障的情况下,您根本不需要将卷控制转移到另一个节点。


如果将Nothing Shared架构的技术与完全重复的存储进行比较,那么乍一看,它在灵活性方面将不如完全实施灾难恢复。 对于存储系统之间的通信线路的组织尤其如此。 因此,在H710模型中,由于使用了不太便宜的InfiniBand有源光缆,因此可以将节点扩展到100m的距离。 但是,即使与其他供应商通过可用的FibreChannel进行同步复制的通常实现方式相比,即使距离更远,AccelStor的解决方案也将更便宜且易于安装/操作,因为 无需安装存储虚拟器和/或与软件集成(从原则上讲,这始终是不可能的)。 另外,不要忘记,AccelStor解决方案是性能比仅带有SSD的“经典”存储系统更高的全闪存阵列。



使用AccelStor的Nothing Shared技术时,以非常合理的成本获得99.9999%的存储系统可用性是现实的。 该解决方案的高可靠性(包括使用两个数据副本)以及专有的FlexiRemap算法可提供令人印象深刻的性能, AccelStor解决方案是构建现代数据中心的关键位置的绝佳候选者。

Source: https://habr.com/ru/post/zh-CN441780/


All Articles