Biostar Racing P1:从简单到复杂

在像Biostar Racing P1这样的微型计算机上,每兆赫兹都很重要。 这是由紧凑性和低功耗决定的。 此处安装了英特尔凌动x5-Z8350处理器 。 而且您不必期望他提供特殊的表演记录。 特别是考虑到L1级缓存的写入性能不佳。

尽管如此,“不再固守,也不是笔记本电脑”的消费者仍然会找到自己的消费者。 保证是看似简单的CPU的四个核心。 他们应该有希望吗?

上一篇文章中,我们分析了在单个线程中执行的缓存测试的结果,从而给出了单个内核的“隔离”性能的概念。 对多核处理器的综合评估是什么? 因此,在NCRB实用程序中设置“ 使用并行操作”复选框,并执行一系列类似的测量。

图1使用NCRB实用程序选择用于平台的多线程测试的方案

多线程L1缓存测试


在Intel Atom x5-Z8350处理器中,一级缓存是四个内核中每个内核的专用资源。 这意味着,当处理一个小于L1大小的数据块(在我们的示例中为24 KB)时,每个内核都使用自己的高速缓存,访问时几乎没有竞争,这意味着我们可以预期,随着数量的增加,性能会成倍增长。核心。 常见的短语“您不会打架”非常准确地描述了这种衡量情况。

图24个处理器内核同时工作时,数据块的读取速度与其大小的关系图; 邻域X =大小L1
对抗参数可能包括一些因素,例如在实现功耗和散热模式的给定场景时降低动态超频的上限,以及限制操作系统在多任务环境中为应用程序分配的处理器时间。

回想一下,在单线程测试中的最高性能(请参阅“ Biostar Racing P1:冷排气 ”)略高于30英镑。 使用4个核,我们得到约107 GBPS的结果,非常接近120 GBPS的理论值。

图3同时工作4个处理器内核时,数据块的写入速度对其大小的依赖关系图; 邻域X =大小L1
检查L1时,对应于最大24KB块的图形的左侧部分很重要。 在这里,我们看到两个性能分数:小事务(超过105 GBPS)的快速部分,以及大于6.4KB的数据的慢部分,但仍然“适合” L1缓存的针眼。 第一个是清楚的:与阅读测试一样,它接近一个核心120 GBPS的四倍值。 为什么再次向L1写入数据失败? 一个人只能对此猜测。

英特尔工程师可能在设计经济型处理器时,将数据缓存的重点从L1转移到了L2。 1级指令缓存仍然有效,Atom x5-Z8350可以满足要求。 在缺乏资源的情况下,处理器会st于不顾一切地花费静态内存来为数据流提供服务,这更多地依赖于第二缓存级别的功能。

这是想到建立负载配置文件以实时处理事务的普遍接受的方法的地方。 普遍接受的标准是读写比率为70%到30%。 大约与分配给“快速”记录到L1缓存中剩余空间的卷相关。 是否可以在此基础上假设英特尔针对Atom处理器,特别是处理流信息(例如媒体内容)?

显然,如果没有对新记录的信息的重新访问,处理器对记录缓存的约束将是有益的:“不必要的”数据的缓存会阻塞内存,迫使“不必要的”数据退出内存。 乍一看,在解压缩媒体内容时执行的写入内存操作对缓存没有好处。 相反,如果您拒绝缓存,则访问先前记录的数据将丢失。

多线程L2缓存测试


第二级缓存的总容量为2兆字节,分为1 MB的两个相等部分,每个部分为一组两个内核提供服务。 这意味着在多线程测试中,每个内核具有512 KB的L2缓存,而在单线程测试中只有1兆字节。 因此,在块的处理速度对其大小的依赖关系图上,拐点应该在X = 512 KB附近,而不是在X = 1024 KB附近,就像在单线程测试中一样(请参见“ Biostar Racing P1:冷排气 ”)。 L2缓存的已考虑拓扑特性也影响对其访问速度的扩展。

图44个处理器内核同时工作时,数据块的读取速度与其大小的关系图; 邻域X =大小L2
性能L2表示满足双重不等式24 KB <X <512 KB的绘图部分,该部分对应于不再适合L1但仍然适合L2的数据块。

图5同时工作4个处理器内核时,数据块的写入速度对其大小的依赖关系图; 邻域X =大小L2
回想一下,在单线程测试中L2的读取速度约为11.5 GBPS。 缩放结果约为39 GBPS。 非常好! 单线程L2写入速度约为12英镑。 缩放结果约为31 GBPS。

代替简历


我们可以说明所研究平台的良好多线程性能水平。 预计将定义L1专用缓存和部分共享的L2的Intel Atom x5-Z8350处理器的体系结构会影响基准测试的结果。

图6使用Windows 10监视CPU利用率:内核负载增加到100%的那一刻对应于测试的运行时间
当您运行多线程测试时,四个处理器内核中每一个的负载都增加到100%。 温度和功耗会怎样?

图7使用AIDA64实用程序监视温度和功耗
在多线程NCRB测试开始大约20分钟后,使用流行的AIDA64诊断和信息实用程序获得了结果。

重要注意事项


要在计算机上重复上述实验,您需要备份数据,确保处理器冷却系统的效率,电源和脉冲控制器Vcore的可靠性。 压力测试可能会损坏超频或不稳定的系统。 最好在国有设备上进行试验。

Source: https://habr.com/ru/post/zh-CN415451/


All Articles