二合一:英特尔傲腾内存H10(第2部分)

第1 部分 >> 第2部分

AnandTech路测-毁灭者


驱逐舰是一个非常漫长的测试,它使用大量I / O复制应用程序访问模式。 与在实际环境中使用时一样,驱动器有时会短暂中断,这允许使用后台垃圾收集和缓存清理,但是这些停机时间限制为25毫秒,因此无需花费整整一周的时间进行一次测试。 AnandTech Storage Bench(ATSB)测试不包括会生成工作负载的实际应用程序的启动,因此估算值对我们新测试台的CPU和RAM性能的变化不是很敏感,但是过渡到更新版本的Windows和新驱动程序会产生显着影响。



我们通过报告平均磁盘吞吐量,平均I / O延迟以及测试过程中驱动器消耗的总能量来评估该测试的结果。



实际上,在禁用缓存的情况下,Optane完全不活动时,Intel Optane Memory H10在The Destroyer中的性能更好。 此测试不会为数据放置的后台优化留很多时间,并且移动的数据总量比32 GB的Optane缓存大得多。 512 GB的QLC NAND缺乏及时清除缓存的性能。





Optane Memory H10本身的QLC一侧的平均延迟得分很低,仅为第99个百分位,而缺少高速缓存只会加剧这种情况。 甚至7200RPM硬盘的性能也更好。





Optane Memory H10的平均读取等待时间比所有基于TLC的驱动器都要差,但要比前面有或没有Optane缓存的HDD好得多。 对于QLC H10记录,当SLC缓存结束时,SSD将发送到最后一个位置。





Optane的缓存对H10读取延迟的第99个百分点有积极影响,使驱动器更接近Crucial MX500 SSD,并且明显优于大型1LC 660p QLC型号。 在第99个百分位中,写入延迟非常糟糕,但是即使缓存溢出导致冗余写入,H10也不比无DRAM的东芝RC100差。

AnandTech路测-重型


与“ Destroyer”相比,我们对“ Heavy”的重载测试按比例提供了更大的记录负载,但所需的时间却少得多。 繁重测试中记录的数据总量不足以填满磁盘,因此性能永远不会下降到稳定的工作状态。 该测试更适用于日常能耗指标,其峰值性能受驱动器峰值性能的影响很大。 有关重载测试的详细数据可以在AnandTech的相应文章中找到。 该测试运行两次,一次在完全擦除的磁盘上,一次在连续记录填充磁盘后进行。



在重载测试中,缓存无疑会加速Intel Optane Memory H10,如果在空磁盘上执行测试,则其平均数据速率将达到基于TLC的优质NVMe SSD的范围。 高速缓存的四轮驱动性能仍然比没有高速缓存时更好,但是最终,Optane无法掩盖QLC NAND在填充SLC之后的行为。 当满载QLC驱动器时,所有基于TLC的驱动器都不会减慢速度。





仅当测试在空磁盘上运行时,H10的平均延迟和99%的延迟才与其他TLC驱动器大致相同。 当重载测试在具有完整SLC缓存和空闲Optane缓存的完整驱动器上运行时,延迟甚至比Optane缓存硬盘更糟。 全轮驱动情况下的平均H10延迟仍然比仅使用部分QLC时要好得多,但是Optane缓存根本无法改善延迟的99%。





在重载测试在完整驱动器上运行时,H10的平均读取延迟显着变差,但仍略优于SATA SSD。 平均写入延迟是QLC看起来特别糟糕的地方,其整数H10比HDD糟糕,并且在禁用Optane缓存的情况下,写入延迟是TLC SSD的十倍。





在全盘测试期间,没有Optane缓存的H10的99读取延迟百分位数是一个严重的问题,但是使用Optane缓存可使读取QoS返回到SSD的合理范围。 99-如果没有Optane高速缓存,则记录延迟的百分位数看起来很糟糕,甚至更糟。

AnandTech路测-轻


与“毁灭者”或“重载”测试相比,我们的轻载测试具有相对更多的连续会话,并且队列深度较小,这是迄今为止最短的测试。 它主要基于不太依赖驱动器性能的应用程序,因此测试结果更有可能显示应用程序的启动时间和文件下载。 该测试可以视为日常使用中所有小延迟的总和,但是如果停机时间减少到25毫秒,则只需不到半小时即可完成测试。 可在AnandTech的相应文章中找到有关Light测试的详细信息。 与ATSB重型测试一样,该测试运行两次:在完全清洁的驱动器上,以及在用顺序记录将光盘装满后。



当Light测试在空白驱动器上运行时,英特尔傲腾内存H10与NVMe低端驱动器竞争。 尽管QLC单个部分的较高性能表明整个H10的评估可能被低估了。 全盘性能要比所有基于TLC的SSD差,但仍比不带Optane缓存的HDD更好。





与TLC NAND相比,Optane Memory H10的平均延迟和99%的延迟具有竞争力。当在空磁盘上进行测试时,即使在满磁盘的情况下,延迟指标仍然优于机械硬盘。





满载驱动器的平均写入延迟是将H10隔离并标识为入门级以上的NVMe驱动器的唯一方法。 在这种情况下,基于TAM的无DRAM东芝RC100变得更糟。





与平均延迟相反,在Optane H10上进行读取和写入的99%延迟表明,填充时遇到很大困难。 Optane缓存不足以弥补SLC缓存的不足。

随机读取性能


第一次随机读取性能测试使用了非常短的一批操作,这些操作一次无队列地执行。 磁盘在包装之间有足够的停机时间,因此总占空比为20%,因此无法进行热调节。 每个程序包包括32 MB的4 KB随机读取,磁盘上的16 GB数据。 读取的数据总量为1 GB。



测试随机读取的短数据包时,数据很容易放在Optane内存H10的Optane高速缓存中,因此它超过了所有基于闪存的固态驱动器,但比使用纯Optane的存储设备要慢得多。

长随机读取性能


连续随机读取的性能测试类似于我们2015年测试套件中的测试:检查队列深度为1到32,并且以QD1,QD2和QD4表示的平均生产率和能源效率是主要指标。 每个队列深度检查一分钟或32 GB的已传输数据,速度更快。 检查每个队列的深度后,驱动器将被冷却一分钟,因此热量的积累不太可能影响队列的较高深度。 单独的读取操作仍为4 KB,并占用64 GB的磁盘。



通过长期的随机读取测试,该测试所覆盖的磁盘范围超出了Optane缓存所能处理的范围,因此H10的性能可与基于TLC的SSD媲美。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512TB


英特尔傲腾SSD 900P 280GB


三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB


WD黑色1TB 7200RPM + Optane内存32GB

与低队列深度的干净QLC存储相比,Optane高速缓存提供的优势较小,但在较高深度的H10中,启用了缓存的功能开始比QLC部件更具优势。 不幸的是,性能仍然很低,并且闪存SSD超过了H10的随机可读性。

随机写入性能


随机写入短数据包的第一个性能测试的结构与读取测试类似,但每个数据包仅占用4 MB,总测试长度为128 MB。 4 KB的随机写入操作分布在16 GB的磁盘上,并且一次执行一次,没有队列。



启用了缓存的随机记录短H10数据包的性能要高于磁盘单独处理的任何一半,但远小于其两部分之和。 TLC驱动器上足够的SLC缓存仍然比QLC上的Optane缓存更好。

与连续随机读取测试一样,我们稳定的4 KB随机写入测试最多可运行1分钟或每个队列深度最多32 GB,跨64 GB磁盘并在队列深度之间为磁盘提供最多1分钟的停机时间,以确保缓存刷新。并冷却光盘。



由于冗长的随机写测试所覆盖的范围比Optane高速缓存所能处理的范围要大得多,因此Optane Memory H10在闪存方面落后于所有竞争对手。 缓存软件最终会产生一个额外的负载,仅使用SLC缓存,其性能就会比QLC部件本身低得多。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512TB


英特尔傲腾SSD 900P 280GB


三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB


WD黑色1TB 7200RPM + Optane内存32GB

Optane存储器H10上的随机写入性能不稳定,但随着队列深度的增加而趋于降低。 彼此相交的两层缓存不是稳定运行的最佳方法。

顺序读取性能


第一个顺序读取性能测试使用128 KB轮外操作发出的128 MB短数据包。 该测试对八个数据包的平均性能进行了测试,总共从包含16 GB数据的磁盘传输了1 GB数据。 在每个包装之间,驱动器有足够的停机时间来维持20%的总占空比。



Optane Memory H10的顺序读取性能远低于基于高性能TLC的驱动器,但与仅限于PCIe3 x2的低级NVMe驱动器相当。 Optane的内存缓存仅比纯QLC速度提供大约10%的速度增加,因此当缓存驱动程序可以有效地共享Optane与NAND之间的访问时,显然不是这种情况。

第二项测试-连续顺序读取-使用从1到32的队列深度,而性能和功耗被计算为QD1,QD2和QD4的平均值。 从包含64 GB数据的磁盘上测试每个队列深度一分钟或最多32 GB数据。 此测试运行两次:一次是通过顺序记录测试数据而准备的驱动器,另一次是在随机记录测试后将所有内容混合在一起,这导致了OS看不见的SSD内部碎片。 这两个估计值代表实际磁盘使用情况的两个极端,其中磨损的分布和对现有数据的修改会产生一些内部碎片,这会对性能产生负面影响,但通常不会达到此处所示的极端程度。



在更长的顺序读取测试中,Optane缓存仍无法有效地结合Optane和NAND H10部件的性能。 但是,当读取未顺序写入的数据时,Optane高速缓存会很有帮助。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512GB


英特尔傲腾SSD 900P 280GB


三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB

在此测试中,Optane高速缓存对于在浅队列深度处的顺序读取来说有点麻烦。 但是在QD8及更高级别上,与仅使用QLC相比,它具有一些优势。

顺序写性能


第一次顺序写入测试的数据包的结构与顺序读取测试相同,但数据传输方向除外。 每个数据包都将128 MB写入QD1中执行的128 KB操作。 总共1 GB的数据写入包含16 GB数据的磁盘。



Optane部分本身中短数据包的顺序写入速度非常低,因此当QLC NAND侧极大地帮助Optane H10时,就是这种情况。 因此,QLC H10与基于TLC的驱动器竞争,但是当缓存软件干扰H10时,可以获得SATA级别的性能。

连续顺序写入测试的结构与相同读取测试的结构相同,只是数据传输的方向不同。 队列深度从1到32不等,将检查每个队列深度一分钟或最多32 GB的已传输数据,然后在磁盘冷却并收集垃圾时检查最多一分钟的停机时间。 该测试受到64 GB磁盘容量的限制。



这种情况通常与先前的测试相似,尽管此处某些低级别的NVMe下降得如此之低,以至于Optane Memory H10评分不再显得如此糟糕。 但是,QLC部分本身在连续顺序写入方面仍比缓存配置好。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512GB


英特尔傲腾SSD 900P 280GB


三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB


WD黑色1TB 7200RPM + Optane内存32GB

在连续顺序写测试期间,H10性能没有明显的趋势。 它主要在QLC和Optane层之间工作,这意味着高速缓存软件会干扰并且不允许两个半部分协同工作,并且提供的性能要优于它们各自。 通过留出更多时间清除Optane和SLC缓存,我们可能会看到完全不同的行为。

混合随机负载性能


混合随机读写测试包括从纯读到纯写的混合,混合增量为10%。 每个混合都经过1分钟或32 GB的传输数据测试。 该测试以4的队列深度进行,并受64 GB磁盘容量的限制。 在每次混合之间的间隔中,驱动器的空闲时间最多为一分钟,因此总占空比为50%。



Optane Memory H10在混合随机I / O测试中的性能比任何一半驱动器都要差。 该测试的覆盖范围超出了32 GB Optane缓存可以承受的范围,因此缓存软件的尝试最终将是有害的。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512GB


英特尔傲腾SSD 900P 280GB

三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB


WD黑色1TB 7200RPM + Optane内存32GB

在测试的读取加载的一半期间,Q10 H10本身的工作方式与Optane缓存配置类似,尽管缓存使性能不一致。 在写入负载期间,与完整的H10设备相比,纯QLC的配置具有显着的速度,直到SLC缓存在最后耗尽为止。

混合顺序负载性能


混合顺序读和写测试与混合测试的不同之处在于,它在随机位置执行128 KB而不是4 KB的顺序访问。 还在线1的深度处执行顺序测试。测试混合物的范围相同,数据传输的时间和限制也与上述相同。



在串行混合I / O测试中,Optane Memory H10平均比SATA SSD稍好,但是H10与高性能TLC驱动器之间仍然存在很大差距。 这是Optane的缓存软件无法始终提供帮助的另一种情况,H10的总体性能略低于具有自己的SLC缓存的纯QLC NAND。

图表

英特尔傲腾内存H10 512GB


英特尔SSD 660p 1TB


英特尔SSD 760p 512GB


英特尔傲腾SSD 900P 280GB

三星970 EVO 500GB


英特尔傲腾内存H10 512GB(QLC)


英特尔傲腾内存H10 512GB(32GB傲腾)


英特尔傲腾内存M10 64GB


战队MP34 512GB


至关重要的MX500 500GB


英特尔傲腾内存32GB


MyDigitalSSD SBX 512GB


西部数据WD Black 7200RPM 1TB


英特尔傲腾SSD 800P 118GB


WD黑色1TB 7200RPM + Optane内存32GB

缓存软件会导致Optane Memory H10的性能不稳定。 但是总的趋势是,当记录时工作负载变得越来越繁重时,性能会下降。 QLC , .

结论


Optane Memory H10背后的想法很有意思。 QLC NAND需要提高性能,才能与基于TLC的SSD竞争,而Intel 3D XPoint内存仍然是市场上最快的非易失性存储系统。 不幸的是,太多因素降低了H10的潜力。 这是同一张卡上的两个单独的SSD,因此在驱动器的NAND侧,仍需要一定数量的RAM,这会增加成本。 缓存是完全由软件控制的,因此SSD NAND控制器和Optane控制器无法相互匹配,并且Intel缓存软件有时很难同时使用磁盘的两个部分。

其中一些问题会因测试条件而变得更加复杂。 我们的测试套件在设计时考虑了SLC写入缓存,但没有二级缓存,有时其功能更像RAID-0。 我们的综合测试均未成功触发Optane和NAND H10部件之间的带宽聚集。 英特尔警告说,他们仅针对实际存储模式优化了缓存算法,很容易看出我们的一些测试如何显示出非常重要的差异。 (特别是,我们的许多测试仅使系统具有仅使用块级缓存的能力,但是Intel软件也可以执行文件级缓存。)但这仅强调了Optane Memory H10并非适用于所有存储系统的通用解决方案。

对于最繁重和最繁重的工作负载,将Optane小型高速缓存放在QLC NAND前面只能避免不可避免的性能下降。 在某些情况下,尝试将正确的数据存储在缓存中会导致更多的性能问题。 但是,生成大量I / O操作的实际应用程序不太可能在15瓦笔记本电脑处理器上很好地工作。 添加Optane高速缓存无法神奇地将低级固态驱动器变成冠军,而Optane Memory H10可能永远不是台式机的好选择,因为台式机可以轻松地容纳比薄型超极本更大的存储选项。

通常,对于超极本而言,在较低负载下,Optane Memory H10通常会与其他预算NVMe竞争,并且在良好条件下比任何NAND闪存驱动器都具有更高的响应速度。 对于日常使用,H10当然比纯QLC驱动器更可取,但与基于TLC的驱动器相比,H10显得较弱。 我们没有机会详细测量Optane Memory H10的功耗,但它不可能提供比基于TLC的顶级固态驱动器更长的电池寿命。

如果英特尔对缓存QLC + Optane的想法很认真,并且想为TLC驱动器提供强大的竞争者,那么他们将不得不做比Optane Memory H10更好的事情。 TLC SSD几乎总是比分层设备具有更稳定的性能。 H10上的Optane高速缓存效率不高,无法在繁重的工作负载下获得良好的性能,而在低负载下,它无法充分提高性能,无法为H10提供优于最佳TLC驱动器的明显优势。 在理想条件下,由于SLC缓存,即使是纯QLC的峰值性能也看起来非常快。 而且,很明显,英特尔应该专注于在最坏的情况下提高性能,而不是优化似乎几乎是瞬间的用例。

Optane在数据仓库市场的某些细分领域取得了巨大的成功,但在消费市场中,它仍在寻找合适的细分市场。 QLC NAND仍然还相对年轻且难以理解,尽管最近大幅降价的承诺终于开始实现。 QLC和Optane的结合也许仍然可以创造出令人印象深刻的消费产品,但是英特尔要比看上去匆忙完成的SSD还要做更多的工作。

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

VPS(KVM)E5-2650 v4(6核)10GB DDR4 240GB SSD 1Gbps直到夏天免费,在六个月内付款,您可以在此处订购。

戴尔R730xd便宜2倍?在荷兰,我们有2台Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100电视 戴尔R420-2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB-$ 99起! 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN451386/


All Articles