传奇的Intel Core i7-2600K:在2019年测试Sandy Bridge(第1部分)

第1部分 >> 第2 部分 >> 第3部分



过去十年中最受欢迎的处理器之一是Intel Core i7-2600K。 该设计具有革命性意义,因为它在单核处理器的性能和效率上实现了重大飞跃,并且该处理器对超频的响应也很好。 接下来的几代英特尔处理器不再显得那么有趣,并且常常没有给用户升级的理由,因此“直到今天我仍将使用我的2600K”这一短语在论坛上已经无处不在。 在这篇评论中,我们用旧处理器摆脱了包装盒中的灰尘,并在2019年通过了一系列基准测试(包括出厂参数和超频),以确保他仍然是冠军。


全家福Core i7

为什么2600K在这一代产品中变得至关重要


坐在椅子上,坐下来想象一下自己在2010年的生活。 今年是您查看旧版Core 2 Duo或Athlon II系统并意识到是该升级的时候了。 您已经熟悉Nehalem的体系结构,并且知道Core i7-920可以很好地加速并且可以与竞争对手匹敌。 那是个好时机,但是突然间,英特尔重新平衡了整个行业,创造了一款真正革命性的产品。 仍留有怀旧的回声。




Core i7-2600K:最快的Sandy Bridge(最高2700K)

这款新产品是Sandy Bridge。 AnandTech发布了独家评论,由于许多原因,结果几乎令人难以置信。 根据我们当时的测试,该处理器比我们之前看到的所有产品都高出无与伦比,特别是考虑到几年前问世的Pentium 4散热怪兽。 基于英特尔32纳米工艺的核心升级是x86性能的最大转折点,从那时起,我们还没有看到这样的突破。 AMD还要花8年的时间才能在Ryzen系列产品中名声大振。 英特尔设法利用其最佳产品的成功优势,并获得了冠军。

在此基本设计中,英特尔并未ski于创新。 关键要素之一是微操作缓存。 这意味着再次需要的新解码指令已被解码,而不是浪费精力进行重新解码。 对于具有Sandy Bridge的英特尔和后来与Ryzen的AMD而言,启用微操作缓存是单线程性能的奇迹。 英特尔还开始改进同步多​​线程(几代人称为超线程),并逐步致力于动态分配计算线程。

Core i7-2600K是发布时最好的处理器的四核设计,成为了下五代Intel架构产品的基础,包括Ivy Bridge,Haswell,Broadwell,Skylake和Kaby Lake。 自桑迪·布里奇(Sandy Bridge)起,尽管英特尔改用更小的工​​艺并利用了较低的功耗,但该公司无法重现团队净带宽的这一飞跃。 后来,这一年的增长率为1-7%,这主要是由于操作缓冲区,执行端口和命令支持的增加。



由于英特尔无法复制Sandy Bridge的突破,并且核心微体系结构是x86性能的关键,因此购买Core i7-2600K(我买了两台)的用户使用了很长时间。 很大程度上是因为期望性能再大提高。 多年来,他们的挫败感越来越大:当四核Sandy Bridge Core i7-2600K仍超频至5.0 GHz时,为什么要投资主频为4.7 GHz的四核Kaby Lake Core i7-7700K?
(英特尔的答案通常与功耗以及通过PCIe 3.0的新功能(例如GPU和驱动器)有关。但是,一些用户对这些解释不满意。)

这就是Core i7-2600K定义了一代的原因。 它一直保持有效,起初是让英特尔高兴,然后是用户不想更新时的失望。 现在,在2019年,我们了解到英特尔已经超越了其主处理器中的四个内核,并且如果用户对于DDR4而言过于昂贵,他可以切换到新的英特尔系统或选择AMD途径。 但是,这是Core i7-2600K如何处理2019年的工作量和游戏的问题; 或者,更确切地说,超频的酷睿i7-2600K如何应对?

发现差异:桑迪桥,卡比湖,咖啡湖


实际上,Core i7-2600K并不是最快的主流Sandy Bridge处理器。 几个月后,英特尔在市场上推出了稍微更高的“高频” 2700K。 它的工作原理几乎相同,并且加速至2600K,但价格略高。 到这个时候,看到性能飞跃并进行升级的用户已经达到了2600K,并且一直坚持下去。

Core i7-2600K是采用HyperThreading技术的32nm四核处理器,基本频率为3.4 GHz,turbo频率为3.8 GHz,标称TDP为95瓦。 那时,英特尔的TDP尚未脱离现实:在本文的测试中,我们发现未时钟的CPU的峰值功耗为88W。 该处理器默认带有Intel HD 3000集成显卡和受支持的DDR3-1333内存。 英特尔在推出该芯片时将价格定为317美元。

在本文中,我使用了第二台i7-2600K,它们是我第一次出现时购买的。 它已在标准频率下进行了测试,并在所有内核上超频至4.7 GHz。 这是平均超频-这些芯片中最好的芯片在日常模式下以5.0 GHz-5.1 GHz的频率运行。 实际上,我还记得我的第一个Core i7-2600K在冬季在室温下进行超频比赛时,在所有内核上甚至在5.3 GHz上(甚至在所有内核上)以5.1 GHz工作的情况在大约2C的温度下,我使用了功能强大的液体冷却器和720mm散热器。 不幸的是,随着时间的流逝,我损坏了该芯片,现在即使在额定频率和电压下也无法加载。 因此,我们应该使用第二块芯片,虽然它不是很好,但是仍然可以对超频处理器有所了解。 超频时,我们还使用了超频的内存DDR3-2400 C11。
值得注意的是,自从Core i7-2600K启动以来,我们已从Windows 7切换到Windows10。Corei7-2600K不支持AVX2指令,并且不是为Windows 10创建的,因此查看在结果上如何显示将特别有趣。




酷睿i7-7700K:采用HyperThreading技术的最新英特尔酷睿i7四核处理器

英特尔发布的带有超线程技术的最快,最新(最新的)四核处理器是Kaby Lake家族的成员Core i7-7700K。 该处理器基于英特尔改进的14纳米制程技术,以4.2 GHz的基本频率和4.5 GHz的Turbo频率运行。 在我们的测试中,其TDP的额定功率为91瓦,显示功耗为95瓦。 它带有Intel Gen9 HD 630图形卡,并支持标准DDR4-2400内存。 英特尔已经发布了一款芯片,声明价格为339美元。
除了7700K之外,英特尔还发布了首款超速超频双核处理器-Core i3-7350K。 在审查过程中,我们对Core i3进行了超频,并在出厂设置下将其与Core i7-2600K进行了比较,试图回答英特尔是否能够实现类似于其旧四核旗舰产品的双核处理器性能的问题。 结果,尽管i3在单线程性能和内存处理方面占了上风,但由于缺少几个核心内核,大多数任务对于Core i3来说太难了。




酷睿i7-9700K:英特尔酷睿i7的最新版本(现已拥有8核)

我们最新的测试处理器是Core i7-9700K。 在当前这一代,它不再是Coffee Lake的旗舰产品(现在是i9-9900K),但它具有八个内核,而无需超速运行。 与拥有9倍内核和线程的9900K进行比较似乎毫无意义,尤其是在i9的价格为488美元时。 相比之下,Core i7-9700K的批量价格仅为374美元,基本频率为3.6 GHz,turbo频率为4.9 GHz。 它的TDP由Intel定义为95瓦,但是在消费型主板上,该芯片在满载时的功耗约为125瓦。 标准支持DDR4-2666内存。



Core i7-2600K被迫与DDR3一起使用,支持PCIe 2.0,而不是PCIe 3.0,并且不旨在与NVMe驱动器一起使用(该测试不涉及该驱动器)。 看看超频老手与Core i7-7700K有多近,以及切换到Core i7-9700K之类后将会看到什么样的增长,将是很有趣的。

桑迪桥:核心架构


在2019年,我们谈论的是具有多达8个高性能内核的100-200 mm2芯片,它们是基于最新的Intel处理技术或AMD GlobalFoundries / TSMC创建的。 但是32纳米的桑迪桥是完全不同的野兽。 没有FinFET晶体管,生产过程仍然“平坦”。 在新的CPU中,实现了第二代High-K,与以前的更大的45nm处理技术相比,实现了0.7倍的缩放。 Core i7-2600K是最大的四核芯片,每216 mm2包含11.6亿个晶体管。 相比之下,最新的14纳米Coffee Lake处理器在约170 mm2的面积上具有八个核心和超过20亿个晶体管。

性能大幅提升的秘密在于处理器的微体系结构。 与上一代Westmere处理器相比,Sandy Bridge承诺(并确保)以相同的时钟速度提供出色的性能,并且还为下个十年的Intel芯片奠定了基础。 随着Sandy Bridge的出现,许多关键的创新首先出现在零售业中,然后重复并改进了许多迭代,逐渐实现了我们今天使用的高性能。

在当前的审查中,我在很大程度上依赖于Anandtech于2010年发布的最初的2600K微体系结构报告。 当然,基于此处理器的现代外观还增加了一些功能。

简短回顾:具有异常执行指令的CPU内核


对于那些不熟悉处理器设计的人,这里快速概述了一个额外处理器的工作方式。 简而言之,内核分为外部和内部接口(前端和后端),并且数据首先到达外部接口。



在外部接口中,我们有预取器和分支预测器,它们将从主存储器中预测和检索指令。 这个想法是,如果您可以预测在不久的将来(需要它们之前)需要哪些数据和指令,则可以通过将这些数据和内核放在靠近内核的位置来节省时间。 然后将指令放入解码器中,该解码器将字节码指令转换为内核可以处理的一系列“微操作”。

对于简单和复杂的指令,有不同类型的解码器-简单的x86指令很容易映射到单个微操作,而更复杂的指令则可以解码用于更多操作。 理想情况是解码系数尽可能低,尽管如果可以并行执行这些指令(在命令级别或ILP上并行执行),则有时可以将它们分为大量的微操作。

如果内核具有微操作缓存,它也是uOp缓存,则每个解码指令的结果都存储在其中。 在对指令进行解码之前,内核会检查该特定指令是否最近已被解码,如果成功,则使用高速缓存中的结果而不是重新解码(这会消耗能量)。

现在,微操作将“分配队列”-分配队列。 现代内核可以确定指令是不是简单周期的一部分,还是可以组合uOps(微操作)来加快整个过程。 然后,将uOps馈入重新排序缓冲区,该缓冲区构成内核的“后端”。

在后端,从重排序缓冲区开始,可以根据每个微操作所需数据的位置重新排列uOps。 此缓冲区可以根据微操作的去向(整数操作或FP)来重命名和分发微操作,并且根据内核,它还可以用作删除已完成指令的机制。 重新排序后,uOps缓冲区将以必要的顺序发送到调度程序,以确保数据已准备就绪并最大化uOp的吞吐量。

调度程序根据需要将uOps发送到执行端口(用于执行计算)。 有些内核为所有端口提供单个调度程序,但在某些情况下,它分为整数/向量运算的调度程序。 大多数执行异常的内核具有4到10个端口(还有更多),这些端口执行必要的计算,以便指令“通过”内核。 执行端口可以采用以下形式:加载模块(从缓存中加载),存储模块(存储在缓存中),整数数学运算模块,带浮点的数学运算模块以及矢量数学运算,特殊除法模块以及一些其他用于特殊运算的形式。 执行端口工作后,可以将数据存储在高速缓存中以备重用,并放置在主存储器中; 这时,指令被发送到删除队列,最后被删除。

此概述未涵盖现代内核用于促进缓存和数据检索的某些机制,例如事务缓冲区,流缓冲区,标记等。某些机制在每一代中都会不断改进,但通常在我们谈论“指令”时每个时钟”作为性能指标,我们努力通过内核(通过前端和后端)“跳过”尽可能多的指令。 该指标取决于处理器前端的解码速度,预取指令,重排序缓冲区以及执行端口的最大使用量,以及每个时钟周期所执行指令的最大数量的去除。

基于上述内容,我们希望读者能够更好地理解在Sandy Bridge发射期间获得的Anandtech测试结果。

桑迪桥照片


Sandy Bridge CPU体系结构在快速的外观上看起来很进化,但是就Nehalem / Westmere以来改变的晶体管数量而言,它是革命性的。 对于Sandy Bridge(及其后的所有微体系结构)而言,最重要的更改是微操作缓存(uOp缓存)。



桑迪桥(Sandy Bridge)中出现了微操作缓存,该缓存在对指令进行解码后对其进行缓存。 没有复杂的算法;仅保存已解码的指令。 当首选的Sandy Bridge收到新指令时,首先在微操作缓存中搜索该指令,如果找到该指令,则其余管道将与该缓存一起使用,并且前端被禁用。 解码硬件是x86管道中非常复杂的部分,将其关闭可以节省大量能源。

这是一个直接映射缓存,可以存储大约1.5 KB的微操作,实际上相当于6 KB的指令缓存。 微操作高速缓存包含在L1指令高速缓存中,对于大多数应用程序,其命中率达到80%。 与指令高速缓存相比,微操作高速缓存的带宽略高且更稳定。 实际的L1指令和数据高速缓存没有更改;它们仍为32 KB(总共64 KB L1)。

可以通过这种机制来缓存来自解码器的所有指令,并且正如我已经说过的那样,其中包含一些特殊的算法-简单来说,所有指令都被缓存了。 场所用完后,长时间未使用的数据将被删除。 微操作缓存似乎与Pentium 4中的跟踪缓存类似,但有一个显着的区别:它不缓存跟踪。 这只是一个指令缓存,它存储微操作而不是宏操作(x86指令)。

除了新的微操作缓存外,英特尔还推出了完全重新设计的分支预测模块。 新的BPU与之前的BPU大致相同,但准确性更高。 准确性的提高是三项重大创新的结果。



标准分支预测器是2位预测器。 表中的每个分支均以适当的可靠性(强/弱)标记为已接受/未接受。 英特尔发现,该双峰预测器预测的几乎所有分支机构都具有“高”置信度。 因此,在桑迪桥中,双峰分支预测器对多个分支使用一个置信度位,而不对每个分支使用一个置信度位。 结果,您的分支历史记录表将具有相同的位数,表示更多的分支,这将导致将来的预测更加准确。

桑迪桥:靠近核心


随着多核处理器的增长,管理核与内存之间的数据流已成为重要的话题。 我们已经看到了许多在CPU上移动数据的不同方式,例如交叉开关,环形,网格以及后来完全分离的I / O芯片。 正如AnandTech先前提到的那样,下一个十年(2020+)的战斗将是核之间联系的战斗,现在已经开始了。
Sandy Bridge的一个功能就是它是Intel的第一个消费类CPU,它使用环形总线连接所有的内核,内存,最后一级的缓存和集成的图形。 这仍然是我们在现代Coffee Lake处理器中看到的相同设计。

环形轮胎


Nehalem / Westmery Bridge在芯片上添加了共享L3缓存的图形处理器和视频转码引擎。 英特尔没有为L3铺设更多的电线,而是引入了环形总线。



在架构上,这与Nehalem EX和Westmere EX中使用的环形总线相同。 每个核心,L3高速缓存(LLC)的每个片段,集成的图形处理器,媒体引擎和系统代理(北桥的一个有趣名称)都连接到环形总线。 : , , . 32 . .

L3, Westmere — 96 /. Sandy Bridge 4 , Westmere, , 384 /.

, L3 36 Westmere 26 — 31 Sandy Bridge ( , , ). , Westmere, - L3 — un-Core , Intel « », - L3. ( «un-Core» .)

- L3, , . , L3 , . L3, , L3 , . .

L3 , . Sandy Bridge L3, . , . Westmere , , Sandy Bridge . , . , , . , «», .


- Intel un-core SB, Sandy Bridge « ». (-, un-core , - ). . 16 PCIe 2.0, x8. DDR3, , , Lynnfield (Clarkdale ).



DMI, PCU ( ). SA , , .

Sandy Bridge


Sandy Bridge Westmere . 10-30%, Sandy Bridge , Intel Westmere (Clarkdale / Arrandale). 45 32 , IPC.

Sandy Bridge 32- , . . GPU . , .



GPU Sandy Bridge, - L3. , L3, , . , , , . .

SNB ( Gen 6) . : , , . – , , .



/ / (execution units), Intel EU. EU . ISA -- API DirectX 10, CISC- . - API IPC EU.

EU . EU, . Intel , , Westmere.
Intel « ». , . , , . , . Intel 64 80, , , 120 Sandy Bridge. - .



, EU.

GPU Sandy Bridge: 6 EU 12 EU. ( ) 12 EU, SKU 6 12 . Sandy Bridge Intel, , Intel , GPU. (2019 .) 24 EU (Gen 9.5), 10- ~ 64 EU (Gen11).

Sandy Bridge Media Engine


GPU Sandy Bridge -. SNB : .

: . Intel SNB, EU. Intel , SNB HD-.



Sandy Bridge. Intel ~ 3- 1080p 30 / iPhone 640 x 360. 14 400 .



/ . Sandy Bridge 3 2 / .

,


Lynnfield Intel, . , TDP 95 , , , -.

, - . , , — , .



Sandy Bridge , PCU TDP ( 25 ). PCU , . , , TDP. , , TDP, , , TDP. SNB TDP, PCU .



CPU, GPU Turbo . , GPU, SNB, CPU, GPU. , CPU, GPU CPU. Sandy Bridge , , .

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

戴尔R730xd便宜2倍?在荷兰,我们有2台Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100电视 戴尔R420-2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB-$ 99起! 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN455610/


All Articles