RAM的进度在哪里,为什么要超频呢?

你好,GT! 我们都喜欢新的硬件-可以在快速的计算机上工作很好,而不用看各种进度条和其他沙漏。 如果使用处理器和视频卡,一切都差不多了:这是新一代,让您的工作效率提高10-20-30-50%,那么使用RAM并不是那么简单。



内存模块的进展在哪里?千兆字节的价格为何几乎没有下降,以及如何取悦您的计算机-在我们的专业教育计划中。

DDR4


DDR4内存标准具有比DDR3更好的优势:最大的最大频率(即带宽),较低的电压(和散热)以及每个模块的容量翻倍。

电子工业联盟(更名为JEDEC)的半导体工程标准化委员会正在努力确保您的金士顿RAM与华硕或技嘉主板匹配,并且每个人都遵守这些规则。 对于电气,物理和连接器,一切都很艰巨(可以理解,必须确保物理兼容性),但是在工作频率,模块体积和延迟方面,这些规则存在一定的波动性:如果您想做得更好,则最重要的是在标准设置中用户没有问题。

这就是当时产生频率高于1600 MHz的DDR3模块和频率高于3200 MHz的DDR4的方式:它们超出了基本规格,并且可以在与所有主板兼容的“标准”参数上使用,并具有极高的外形(XMP),经过工厂测试,并连接到BIOS内存中。



进度


该领域的重大改进同时在多个方向上进行。 首先,直接存储芯片的制造商(海力士,三星,美光和东芝)正在不断改进采用相同工艺技术的芯片的内部架构。 从修订版到修订版,内部拓扑结构都得到了完善,从而确保均匀加热和可靠运行。

其次,内存正在慢慢转向新的处理技术。 不幸的是,在这里不可能像视频卡或中央处理器的制造商(过去10年制造的)那样迅速地进行改进:工作部件(即晶体管)的大小全面减少将需要相应地降低工作电压,这受JEDEC标准和CPU内置存储器控制器的限制。 。

因此,唯一剩下的不仅是“收紧”生产标准,而且还要同时提高每个微电路的速度,这将需要相应地增加电压。 结果,两个频率都增加并且一个模块的体积增加。

有很多这样的例子。 在2009-2010年,每个模块在2/4 GB的DDR3 1066 MHz和DDR3 1333 MHz之间进行选择是正常的(两者均使用90纳米工艺技术进行)。 如今,尽管内部32、30甚至28 nm,但已经准备就绪的标准已准备就绪,可以在4、8和16 GB模块上为您提供1600、1866、2000甚至2133 MHz的工作频率。

不幸的是,这样的升级要花很多钱(主要用于研究,购买设备和调试生产过程),因此您不必等待DDR5之前1 GB RAM的价格大幅度下降:嗯,我们将看到具有相同功能的另一个有用特性翻倍生产成本。

改进,超频和寻求平衡的代价


工作量和工作速度的增长直接影响RAM的另一个参数-延迟(它们也是计时)。 微电路在高频下的操作仍然不希望违反物理定律,并且各种操作(在微电路上搜索信息,读取,写入,更新单元)需要一定的时间间隔。 减少技术过程是有回报的,并且时序的增长比工作频率的增长更慢,但在此处必须在线性读取速度和响应速度之间取得平衡。



例如,内存可以在相同的一组定时(15-15-15-29)上工作于2133 MHz和2400 MHz配置文件-在这种情况下,超频是合理的:在几个时钟周期的较高延迟频率下,它只会减少并且不仅会提高线性速度阅读,而且响应速度快。 但是,如果下一个阈值(2666 MHz)需要将延迟增加1-2,甚至3个单位,则值得考虑。 让我们做一些简单的计算。

将工作频率除以第一时间(CAS)。 该比率越高,越好:
2133/15 = 142.2
2400/15 = 160
2666/16 = 166.625
2666/17 = 156.823

结果值是分母1秒/ X * 1 000000。即,数字越大,从存储控制器接收信息和将数据发送回之间的延迟越短。

从计算中可以看出,最大的增长是在相同的时序下从2133 MHz升级到2400 MHz。 将延迟增加1个时钟(这对于在2666 MHz的频率上稳定运行必不可少)仍然有好处(但不是很严重),如果内存以增加的频率运行且仅增加2个单位的定时,则性能相对于2400 MHz甚至会略有下降。

反之亦然:如果模块绝对不希望增加频率(也就是说,您已经找到了特定内存集的极限),则可以尝试通过减少延迟来赢得“免费”性能。

实际上,还有更多因素,但是即使是这些简单的计算也不会破坏内存超频:如果结果变得比平均水平差,则从模块中挤出最大速度是没有意义的。



内存超频的实际应用


在软件方面,这样的操作主要受益于以下任务:这些任务不是在流读取模式下就不断利用内存,而是提取随机数据。 也就是说,游戏,Photoshop和各种编程任务。



但是,在减少延迟和增加工作频率时,处理器中具有集成图形的硬件系统(并且没有其自己的视频内存)都会获得显着的性能提升:简单的控制器和低带宽通常会成为集成GPU的瓶颈。 因此,如果您最喜欢的“坦克”几乎没有爬到旧计算机的内置图形上,您就会知道可以采取什么措施来改善这种情况。

主流


奇怪的是,普通用户从此类改进中受益最大。 不,当然,拥有充沛资金的超频者,专业人士和玩家使用频率异常高的极限模块可以获得0.5%的性能,但它们的市场份额很小。

到底是什么?


白铝散热器易于拆卸。 零步:我们已将电池或其他与地面接触的金属接地,并释放了静电-我们不想发生可笑的事故来杀死内存模块吗?

第一步:我们用吹风机或活动的读写负载为内存模块加温(在第二种情况下,您需要快速关闭PC,关闭电源,并在内存仍然很热时卸下RAM)。



第二步:找到没有贴纸的一面,然后轻轻拿起散热器,使散热器的中心和边缘周围都有东西。 可以使用印刷电路板作为杠杆的基础,但要小心。 仔细选择一个支点,尽量避免对易碎元素施加压力。 最好按照“缓慢而确定”的原则行事。

第三步:打开散热器并断开锁。 在这里,它们是珍贵的筹码。 一侧焊接。 制造商-Micron,芯片型号6XA77 D9SRJ。



8件,每件1 GB,出厂配置文件为2400 MHz @ CL16。


没错,这不值得在家里拆掉热量分配器-您会撕开封条,并且1年保修就哭了。 是的,原生散热器在分配给它们的功能方面做得很好。

让我们使用HyperX Fury HX426C16FW2K4 / 32套件的示例来尝试对RAM超频的影响。 名称的解码会为我们提供以下信息:HX4-DDR4,26-工厂频率2666 MHz,C16-CL16延迟。 接下来是散热器的颜色代码(在我们的示例中为白色),K4 / 32套件的描述是一组4个模块的集合,总容量为32 GB。 也就是说,已经可以看到在生产过程中RAM稍微超频了:以相同的时序拼接了2666 MHz配置文件,而不是标准的2400。



除了在您的PC上考虑四个“白雪公主”的美学乐趣外,该套件还准备提供重达32 GB的内存,并且针对确实不喜欢CPU超频的常规处理器的用户。 末尾没有字母K的现代Intel已经完全丧失了获得免费性能的所有可能方法,并且实际上不从频率高于2400 MHz的内存中获得任何奖励。



我们以两台计算机作为测试平台。 一个基于Intel Core i7-6800K和ASUS X99主板(它为发烧友提供了一个具有四通道内存控制器的平台),第二个内部装有Core i5-7600(这将淘汰具有集成显卡和超频功能的主流硬件)。 首先,我们将检查内存的超频潜力,其次,我们将测量游戏和工作软件的真实性能。

超频潜力


对于标准的JEDEC配置文件和出厂的XMP存储器,具有以下操作模式:
DDR4-2666 CL15-17-17 @ 1.2V
DDR4-2400 CL14-16-16 @ 1.2V
DDR4-2133 CL12-14-14 @ 1.2V

容易注意到,2400 MHz的时序设置使内存的响应性不如2133和2666 MHz配置文件。
2133/12 = 177.75
2400/14 = 171.428
2666/15 = 177.7(3)

尝试以2900 MHz的频率启动内存,但将延迟增加到16-17-18、17-18-18、17-19-19,甚至将电压提高到1.3伏也没有用。 没有严重的负载,计算机就可以工作,但是Photoshop,存档程序或基准测试会吐出错误或将系统转储到BSOD中。 似乎模块的频率潜力被选择到了最后,剩下的唯一的事情就是减少延迟。



用4个模块的测试套件-2666 MHz的定时CL13-14-13可获得最佳结果。 这将显着提高访问随机数据的速度(2666/13 = 205.07),并且应该在游戏基准测试中显示出很好的结果。 在双通道模式下,内存可以更好地加速: oclab的专家设法将一组两个16 GB模块以CL14-15-15-28的频率达到3000 MHz的频率,电压升高了1.4伏,这是一个很好的结果。



全面测试


对于我们的带有集成显卡的i5,我们选择GTA V作为基准游戏,这款游戏还不算年轻,它使用DirectX 11 API,该API早已为人所知,并且在Intel驱动程序中得到了很好的体现,它喜欢消耗RAM并立即在各个方面加载系统:GPU,CPU,Ram从磁盘读取。 经典版 伴随着这一点,GTA V使用了所谓的 “延迟渲染”,因此,帧计算时间较少依赖于场景的复杂性,也就是说,测试过程将更简洁,结果更清晰。

对于平均FPS,我们采用适合游戏正常过程的值:飞机的飞行,在城市中的骑行,对手的消灭具有统一的负载曲线。 对于此类场景(从数据数组中丢弃最佳和最差结果的1%)并获得平均游戏FPS。

缩编可以类似的方式从具有爆炸和复杂效果的场景(桥下的瀑布,日落风景)中确定。

即使是在巨大的GTX 1080Ti上,即使在剧烈的环境变化(从一个测试用例切换到另一个测试用例)中,也会出现卡纸和令人不快的现象,我们会尝试加以注意,但我们不会将它们纳入结果:游戏中不会发生,这很可能是基准测试本身的卡住。

演示台配置
CPU:英特尔酷睿i5-7500(4c4t @ 3.8 GHz)
GPU: Intel HD530
内存: 32 GB HyperX Fury White(2133 MHz CL12、2666 MHz CL15和2666 MHz CL13)
MB:华硕B250M
固态硬盘:金士顿A400 240 GB

首先,让我们设置XMP配置文件的标准频率:2666 MHz,定时15-17-17。 GTA V内置基准在720p分辨率的最小和中等设置下产生相同的FPS和相同的下降:在大多数场景中,计数器在30–32左右波动,在较重的场景中,当将一个位置更改为另一个位置时,FPS会下垂。



原因很明显-GPU容量足够,但是光栅化单元没有时间每秒收集和绘制更多帧。 在“高”图形设置下,结果迅速恶化:游戏开始直接依靠集成图形的适度计算能力。

2133 MHz的CL12


GPU没有自己的内存,因此被迫不断拉动系统。 在2133 MHz频率的两通道模式下,DDR4的带宽将为64位(8字节)×2 133000000 MHz×2通道-约34 Gb / s,开销损失很小(最多10%)。

相比之下,最适度的分立NVIDIA GTX 1030卡的内存子系统带宽为48 Gb / s,而GTX 1050 Ti(在FullHD的最大设置下很容易发出GTA V 60 FPS)已经是112 Gb / s。


在背景中,您可以看到桥下的同一瀑布,从而降低了游戏内基准测试的FPS。

基准测试结果平均下降到28 FPS,并且在更改位置时发生滞后,并且无应力压降的爆炸变成令人不快的微冻。

2666 MHz的CL13


时间的减少大大减少了内存响应的等待时间,并且我们已经有了该频率的标准结果:我们可以比较三个基准并获得清晰的画面。 2666 MHz的带宽已经是21.3 Gb / s×2通道〜40 Gb / s,与年轻的NVIDIA相当。



最高FPS实际上并没有增加(0.1并不是一个指标,并且处于测量误差的边缘)-在这里,我们仍然依靠ROP的适度功能,但是所有亏损都变得不那么明显。 在有瀑布的场景中,由于高计算量,结果在其他所有方面都没有改变-也就是说,下载,爆炸和其他使视频核心变慢的乐趣,它的平均增长率为10-15%。 充满事件的情节不是25–27帧,而是28–29。 通常,游戏开始变得更加舒适。

TL; DR和结果


您不能仅在一个频率上评估RAM的速度。 DDR4具有相当大的时钟延迟,并且在其他所有条件都相同的情况下,值得选择的内存不仅要满足您的硬件在工作频率和容量方面的需求,而且还要注意此参数。



测试表明,使用带有低延迟的高速内存时,基于Intel Core i-Series和集成显卡的计算机将获得明显的性能提升。 视频核心没有自己的资源来存储和处理数据,并且使用系统完美地响应(达到一定限制)频率的增加和时序的减少,因为渲染包含许多对象的帧的时间直接取决于访问内存的速度。

最重要的是! Fury系列有多种颜色可供选择:白色,红色和黑色-您不仅可以选择快速存储,还可以像HyperPC专家一样选择样式合适的其余组件。



基尔霍夫定律和一点学校魔术使我们可以说,带有黑色散热器的内存在工作中会比其他选项凉爽一些。 好吧,对于那些不相信神圣物理学的人,在教育频道MEPhI上有一个绝妙的证明

如果主流解决方案无所不包,那么在高端细分市场(每位系统工程师都只是小菜一碟),使用来自普通产品线的内存和HyperX驱动器就是一个质量标志。 在创建每个自定义项目时,必须考虑许多因素:热负荷,反复无常的客户的愿望,空气分配,声学问题(功能强大的计算机和功能强大的安静计算机的复杂程度相差一个数量级)。 HyperPC不断改进其流程,并始终忠实于可靠的组件-因此,在其独特的组装中获得了出色的成绩。 但是,如果您喜欢现成的计算机(可以自动完成),则可以在Yulmart网络上购买类似的套件或单个HyperX Fury DDR4模块。

仅此而已,但我们不会说再见。 夏日凉爽-热门话题,订阅我们的博客 ,所有有趣的事情都不会过去。



1-由于俄罗斯法律的特殊性,“终身”保证从购买之日起仅10年有效。 但是,就计算机硬件而言,以当前的技术发展步伐和10年的时间并不短,并且法律可能会发生变化。

Source: https://habr.com/ru/post/zh-CN404701/


All Articles