Bagian 1 >>
Bagian 2 >>
Bagian 3
Salah satu prosesor paling populer dalam dekade terakhir adalah Intel Core i7-2600K. Desainnya revolusioner, karena menawarkan lompatan signifikan dalam kinerja dan efisiensi prosesor single-core, dan prosesor tersebut juga merespons dengan baik terhadap overclocking. Beberapa generasi berikutnya dari prosesor Intel tidak lagi terlihat begitu menarik, dan seringkali tidak memberikan alasan kepada pengguna untuk meningkatkan, sehingga frasa "Saya akan tetap menggunakan 2600K" telah menjadi mana-mana di forum dan terdengar bahkan hingga hari ini. Dalam ulasan ini, kami menyingkirkan debu dari kotak dengan prosesor lama dan mengusir veteran melalui serangkaian tolok ukur pada tahun 2019, baik pada parameter pabrik dan dalam overclocking, untuk memastikan bahwa ia masih juara.
Foto Keluarga Core i7Mengapa 2600K menjadi sangat penting bagi generasi ini
Duduk di kursi, duduk dan bayangkan diri Anda di tahun 2010. Ini adalah tahun ketika Anda melihat sistem Core 2 Duo atau Athlon II yang lama dan menyadari bahwa sudah waktunya untuk peningkatan. Anda sudah terbiasa dengan arsitektur Nehalem, dan Anda tahu bahwa Core i7-920 berakselerasi dengan baik dan mampu bersaing. Itu adalah saat yang tepat, tetapi tiba-tiba Intel menyeimbangkan industri dan menciptakan produk yang benar-benar revolusioner. Gema nostalgia yang sampai sekarang masih terdengar.

Core i7-2600K: Sandy Bridge tercepat (hingga 2700K)Produk baru ini adalah Sandy Bridge. AnandTech merilis ulasan eksklusif, dan hasilnya hampir mustahil untuk dipercaya, karena berbagai alasan. Menurut pengujian kami pada waktu itu, prosesor itu jauh lebih tinggi dari semua yang kami lihat sebelumnya, terutama mengingat monster termal Pentium 4 yang keluar beberapa tahun sebelumnya. Peningkatan inti berdasarkan proses 32nm dari Intel adalah titik balik terbesar dalam kinerja x86, dan sejak itu kami belum melihat terobosan semacam itu. AMD akan membutuhkan 8 tahun lagi untuk mendapatkan momen ketenarannya dengan seri Ryzen. Intel berhasil memanfaatkan kesuksesan produk terbaiknya, dan mendapatkan tempat juara.
Dalam desain dasar ini, Intel tidak berhemat pada inovasi. Salah satu elemen kunci adalah cache operasi mikro. Ini berarti bahwa instruksi yang baru diterjemahkan, yang diperlukan lagi, diambil sudah diterjemahkan, daripada membuang-buang energi pada pengodean ulang. Untuk Intel dengan Sandy Bridge, dan jauh kemudian untuk AMD dengan Ryzen, mengaktifkan cache mikro-operasional adalah keajaiban untuk kinerja single-threaded. Intel juga mulai meningkatkan multithreading secara simultan (yang selama beberapa generasi disebut HyperThreading), secara bertahap bekerja pada alokasi dinamis dari thread komputasi.
Desain quad-core prosesor terbaik saat diluncurkan, Core i7-2600K, menjadi basis produk dalam lima generasi arsitektur Intel berikutnya, termasuk Ivy Bridge, Haswell, Broadwell, Skylake dan Kaby Lake. Sejak Sandy Bridge, meskipun Intel beralih ke proses yang lebih kecil dan mengambil keuntungan dari konsumsi daya yang lebih rendah, korporasi belum mampu menciptakan lompatan luar biasa ini dalam bandwidth bersih tim. Kemudian, pertumbuhan untuk tahun ini adalah 1-7%, terutama karena peningkatan buffer operasional, port eksekusi dan dukungan perintah.

Karena Intel tidak dapat meniru terobosan Sandy Bridge, dan arsitektur mikro inti adalah kunci kinerja x86, pengguna yang membeli Core i7-2600K (saya membeli dua) tetap menggunakannya untuk waktu yang lama. Sebagian besar karena harapan lompatan besar dalam kinerja. Dan selama bertahun-tahun, frustrasi mereka meningkat: mengapa berinvestasi dalam quad-core Kaby Lake Core i7-7700K clock di 4,7 GHz ketika quad-core Sandy Bridge Core i7-2600K Anda masih di-overclock ke 5,0 GHz?
(Jawaban Intel biasanya terkait dengan konsumsi daya dan fitur baru seperti GPU dan drive melalui PCIe 3.0. Tetapi beberapa pengguna tidak puas dengan penjelasan ini.)
Itu sebabnya Core i7-2600K telah menetapkan generasi. Tetap valid, pada awalnya untuk kesenangan Intel, dan kemudian kekecewaan ketika pengguna tidak ingin memperbarui. Sekarang, pada tahun 2019, kami memahami bahwa Intel telah melampaui empat inti dalam prosesor utamanya, dan jika pengguna terlalu mahal untuk DDR4, ia dapat beralih ke sistem Intel yang baru atau memilih jalur AMD. Tapi inilah pertanyaan tentang bagaimana Core i7-2600K menangani beban kerja dan game 2019; atau, lebih tepatnya, bagaimana Core i7-2600K yang di-overclock mengatasi?
Temukan perbedaannya: Sandy Bridge, Kaby Lake, Coffee Lake
Sebenarnya, Core i7-2600K bukan prosesor Sandy Bridge arus utama tercepat. Beberapa bulan kemudian, Intel meluncurkan "frekuensi tinggi" 2700K sedikit lebih di pasar. Itu bekerja hampir sama, dan dipercepat mirip dengan 2600K, tetapi harganya sedikit lebih. Pada saat ini, pengguna yang melihat lompatan dalam kinerja dan peningkatan sudah di 2600K, dan tetap dengan itu.
Core i7-2600K adalah prosesor quad-core 32nm dengan teknologi HyperThreading, dengan frekuensi dasar 3,4 GHz, frekuensi turbo 3,8 GHz, dan TDP nominal 95 watt. Kemudian TDP Intel belum bercerai dari kenyataan: dalam pengujian kami untuk artikel ini, kami melihat konsumsi daya puncak 88 W pada CPU yang tidak di-clocked. Prosesor datang dengan grafis terintegrasi Intel HD 3000 dan mendukung memori DDR3-1333 secara default. Intel menetapkan harga $ 317 saat meluncurkan chip.
Untuk artikel ini, saya menggunakan i7-2600K kedua, yang saya beli saat pertama kali muncul. Itu diuji baik pada frekuensi standar dan di-overclock ke 4,7 GHz pada semua core. Ini adalah overclocking rata-rata - yang terbaik dari chip ini beroperasi pada frekuensi 5,0 GHz - 5,1 GHz dalam mode sehari-hari. Bahkan, saya ingat betul bagaimana Core i7-2600K pertama saya bekerja pada 5,1 GHz pada semua core, dan bahkan 5,3 GHz (juga pada semua core), ketika selama kompetisi overclocking di tengah musim dingin, pada suhu kamar pada suhu sekitar 2C, saya menggunakan cairan pendingin yang kuat dan radiator 720mm. Sayangnya, seiring waktu, saya merusak chip ini, dan sekarang tidak memuat bahkan pada frekuensi dan tegangan nominal. Jadi, kita harus menggunakan chip kedua saya, yang tidak begitu baik, tetapi masih bisa memberikan gambaran tentang prosesor yang di-overclock. Saat melakukan overclocking, kami juga menggunakan memori overclock, DDR3-2400 C11.
Perlu dicatat bahwa sejak peluncuran Core i7-2600K kami beralih dari Windows 7 ke Windows 10. Core i7-2600K tidak mendukung instruksi AVX2, dan tidak dibuat untuk Windows 10, jadi akan sangat menarik untuk melihat bagaimana ini ditampilkan pada hasil.

Core i7-7700K: prosesor Intel Core i7 quad-core terbaru dengan teknologi HyperThreadingProsesor Quad-core tercepat dan terbaru (dan terbaru?) Dengan HyperThreading, dirilis oleh Intel, adalah Core i7-7700K, anggota keluarga Danau Kaby. Prosesor ini dibangun di atas teknologi proses 14nm Intel yang ditingkatkan, beroperasi pada frekuensi dasar 4,2 GHz dan frekuensi turbo 4,5 GHz. TDP-nya dengan daya terukur 91 watt dalam pengujian kami menunjukkan konsumsi daya 95 watt. Muncul dengan grafis Intel Gen9 HD 630 dan mendukung memori DDR4-2400 standar. Intel telah merilis sebuah chip dengan harga yang dinyatakan sebesar 339 dolar.
Seiring dengan 7700K, Intel juga merilis prosesor dual-core overclock pertama dengan hypertreading - Core i3-7350K. Dalam ulasan ini, kami melakukan overclock Core i3 dan membandingkannya dengan Core i7-2600K di pengaturan pabrik, mencoba menjawab pertanyaan apakah Intel berhasil mencapai kinerja prosesor dual-core yang mirip dengan flagship quad-core lama mereka. Akibatnya, sementara i3 menang dalam kinerja single-threaded dan bekerja dengan memori, kurangnya beberapa core dalam akun membuat sebagian besar tugas terlalu sulit untuk Core i3.

Core i7-9700K: puncak terbaru dari Intel Core i7 (sekarang dengan 8 core)Prosesor terbaru kami untuk pengujian adalah Core i7-9700K. Pada generasi saat ini, ini bukan lagi unggulan dari Coffee Lake (sekarang i9-9900K), tetapi memiliki delapan core tanpa hipertensi. Perbandingan dengan 9900K, yang memiliki inti dan utas dua kali lebih banyak, tampaknya tidak ada gunanya, terutama ketika harga i9 adalah $ 488. Sebaliknya, Core i7-9700K dijual secara massal dengan harga "hanya" $ 374, dengan frekuensi basis 3,6 GHz dan frekuensi turbo 4,9 GHz. TDPnya ditentukan oleh Intel pada 95 watt, tetapi pada motherboard konsumen, chip tersebut mengkonsumsi ~ 125 watt pada beban penuh. Memori DDR4-2666 didukung sebagai standar.

Core i7-2600K dipaksa untuk bekerja dengan DDR3, mendukung PCIe 2.0, bukan PCIe 3.0, dan tidak dirancang untuk bekerja dengan drive NVMe (yang tidak terlibat dalam pengujian ini). Akan menarik untuk melihat seberapa dekat veteran yang di-overclock dengan Core i7-7700K, dan pertumbuhan apa yang akan kita lihat ketika kita beralih ke sesuatu seperti Core i7-9700K.
Sandy Bridge: Core Architecture
Pada tahun 2019, kita berbicara tentang chip 100-200 mm2 dengan hingga delapan core berkinerja tinggi, dan dibuat pada teknologi proses Intel terbaru atau AMD GlobalFoundries / TSMC. Tapi Sandy Bridge 32nm adalah binatang yang sama sekali berbeda. Proses produksinya masih "flat", tanpa transistor FinFET. Dalam CPU baru, generasi kedua dari High-K diimplementasikan, dan penskalaan 0,7x dicapai dibandingkan dengan teknologi proses 45nm sebelumnya yang lebih besar. Core i7-2600K adalah chip quad-core terbesar, dan berisi 1,16 miliar transistor per 216 mm2. Sebagai perbandingan, prosesor Coffee Lake terbaru pada 14 nm memiliki delapan core dan lebih dari 2 miliar transistor di area ~ 170 mm2.
Rahasia untuk lompatan kinerja besar terletak pada arsitektur mikro prosesor. Sandy Bridge menjanjikan (dan memastikan) kinerja yang signifikan pada kecepatan clock yang sama dibandingkan dengan prosesor Westmere generasi sebelumnya, dan juga membentuk sirkuit dasar untuk chip Intel untuk dekade berikutnya. Banyak inovasi kunci pertama kali muncul di ritel dengan munculnya Sandy Bridge, dan kemudian banyak iterasi diulang dan ditingkatkan, secara bertahap mencapai kinerja tinggi yang kami gunakan saat ini.
Dalam ulasan saat ini, saya sangat bergantung pada laporan awal 2600K mikroarsitektur Anandtech, yang dirilis pada 2010. Tentu saja, dengan beberapa tambahan berdasarkan tampilan modern pada prosesor ini.
Ulasan singkat: Inti CPU dengan eksekusi instruksi yang luar biasa
Bagi mereka yang baru mengenal desain prosesor, berikut ini ikhtisar singkat tentang cara kerja prosesor ekstra-prosesor. Singkatnya, kernel dibagi menjadi antarmuka eksternal dan internal (ujung depan dan ujung belakang), dan data pertama-tama pergi ke antarmuka eksternal.

Di antarmuka eksternal, kami memiliki prefetcher dan prediktor cabang yang akan memprediksi dan mengambil instruksi dari memori utama. Idenya adalah bahwa jika Anda dapat memprediksi data dan instruksi apa yang akan dibutuhkan dalam waktu dekat (sebelum dibutuhkan), Anda dapat menghemat waktu dengan menempatkan data ini di dekat kernel. Kemudian instruksi ditempatkan dalam decoder, yang mengubah instruksi bytecode menjadi serangkaian "operasi mikro" yang kemudian dapat diproses oleh kernel.
Ada berbagai jenis decoder untuk instruksi sederhana dan kompleks - instruksi x86 sederhana mudah dipetakan ke operasi mikro tunggal, sementara instruksi yang lebih kompleks dapat diterjemahkan untuk operasi lebih lanjut. Situasi yang ideal adalah koefisien dekode serendah mungkin, meskipun kadang-kadang instruksi dapat dibagi menjadi sejumlah besar operasi mikro jika operasi ini dapat dilakukan secara paralel (paralelisme di tingkat perintah atau ILP).
Jika kernel memiliki cache operasi mikro, itu juga merupakan cache uOp, maka hasil dari setiap instruksi yang diterjemahkan disimpan di dalamnya. Sebelum instruksi didekodekan, kernel memeriksa apakah instruksi khusus ini telah diterjemahkan baru-baru ini, dan jika berhasil, menggunakan hasil dari cache alih-alih decoding, yang menghabiskan energi.
Sekarang operasi mikro memasukkan "antrian untuk alokasi" - antrian alokasi. Inti modern dapat menentukan apakah instruksi merupakan bagian dari siklus sederhana, atau apakah uOps (operasi mikro) dapat digabungkan untuk mempercepat keseluruhan proses. Kemudian, uOps dimasukkan ke dalam buffer re-order, yang membentuk "back end" dari kernel.
Di backend, dimulai dengan buffer pemesanan ulang, uOps dapat diatur ulang tergantung di mana data yang dibutuhkan oleh setiap operasi mikro berada. Buffer ini dapat mengubah nama dan mendistribusikan operasi mikro tergantung pada tujuan mereka (operasi integer atau FP), dan, tergantung pada kernel, buffer ini juga dapat bertindak sebagai mekanisme untuk menghapus instruksi yang telah selesai. Setelah memesan ulang, buffer uOps dikirim ke penjadwal dengan urutan yang diperlukan untuk memastikan data siap dan memaksimalkan throughput uOp.
Penjadwal mengirimkan uOps ke port eksekusi (untuk melakukan perhitungan) sesuai kebutuhan. Beberapa kernel memiliki penjadwal tunggal untuk semua port, tetapi dalam beberapa kasus dibagi menjadi penjadwal untuk operasi integer / vektor. Sebagian besar kernel dengan eksekusi luar biasa memiliki 4 hingga 10 port (lebih banyak), dan port-port ini melakukan perhitungan yang diperlukan sehingga instruksi "melewati" melalui kernel. Eksekusi port dapat berupa modul pemuatan (memuat dari cache), modul penyimpanan (menyimpan dalam cache), modul operasi matematika integer, modul operasi matematika dengan titik mengambang, serta operasi matematika matematika, modul divisi khusus, dan beberapa lainnya untuk operasi khusus . Setelah port eksekusi berhasil, data dapat disimpan dalam cache untuk digunakan kembali, ditempatkan di memori utama; saat ini, instruksi dikirim ke antrian penghapusan, dan akhirnya dihapus.
Tinjauan ini tidak mencakup beberapa mekanisme yang digunakan kernel modern untuk memfasilitasi caching dan pengambilan data, seperti buffer transaksi, buffer aliran, penandaan, dll. Beberapa mekanisme secara iteratif membaik dengan setiap generasi, tetapi biasanya ketika kita berbicara tentang "instruksi" per clock "sebagai indikator kinerja, kami berusaha untuk" melewati "sebanyak mungkin instruksi melalui kernel (melalui frontend dan backend). Indikator ini tergantung pada kecepatan decoding di ujung depan prosesor, instruksi pra-pengambilan, buffer pemesanan ulang, dan penggunaan maksimum dari port eksekusi bersama dengan penghapusan jumlah maksimum dari instruksi yang dieksekusi untuk setiap siklus clock.
Berdasarkan hal tersebut di atas, kami berharap bahwa pembaca akan dapat lebih memahami hasil tes Anandtech yang diperoleh selama peluncuran Sandy Bridge.
Sandy Bridge: Front End
Arsitektur Sandy Bridge CPU terlihat evolusioner dalam pandangan cepat, tetapi revolusioner dalam hal jumlah transistor yang telah berubah sejak Nehalem / Westmere. Perubahan terpenting untuk Sandy Bridge (dan semua arsitektur mikro setelahnya) adalah cache mikro-operasional (cache uOp).

Cache mikro-operasional telah muncul di Sandy Bridge, yang cache instruksi setelah decoding mereka. Tidak ada algoritma yang rumit, instruksi yang diterjemahkan hanya disimpan. Ketika Preetter Sandy Bridge menerima instruksi baru, instruksi pertama kali dicari dalam cache operasi mikro, dan jika ditemukan, sisa pipa bekerja dengan cache, dan frontend dinonaktifkan. Perangkat keras decoding adalah bagian yang sangat kompleks dari pipa x86, dan mematikannya menghemat banyak energi.
Ini adalah cache pemetaan langsung, dan dapat menyimpan sekitar 1,5 KB operasi mikro, yang sebenarnya setara dengan cache instruksi 6 KB. Cache operasi mikro termasuk dalam cache instruksi L1, dan hit rate-nya untuk sebagian besar aplikasi mencapai 80%. Cache operasi mikro memiliki bandwidth yang sedikit lebih tinggi dan lebih stabil dibandingkan dengan cache instruksi. Instruksi L1 aktual dan cache data belum berubah, masing-masing masih 32 KB (total 64 KB L1).
Semua instruksi yang berasal dari dekoder dapat di-cache oleh mekanisme ini, dan, seperti yang sudah saya katakan, ada beberapa algoritma khusus di dalamnya - sederhananya, semua instruksi di-cache. Data lama yang tidak digunakan dihapus saat tempat itu habis. Cache mikro-operasional mungkin tampak mirip dengan cache jejak di Pentium 4, tetapi dengan satu perbedaan signifikan: cache tidak melacak cache. Ini hanyalah sebuah cache instruksi yang menyimpan operasi mikro alih-alih operasi makro (instruksi x86).
Seiring dengan cache mikro-operasional baru, Intel juga memperkenalkan modul prediksi cabang yang sepenuhnya didesain ulang. BPU baru hampir sama dengan pendahulunya, tetapi jauh lebih akurat. Akurasi yang meningkat adalah hasil dari tiga inovasi besar.

Prediktor cabang standar adalah prediktor 2-bit. Setiap cabang ditandai dalam tabel sebagai diterima / tidak diterima dengan keandalan yang sesuai (kuat / lemah). Intel menemukan bahwa hampir semua cabang yang diprediksi oleh prediktor bimodal ini memiliki kepercayaan "tinggi". Oleh karena itu, di Sandy Bridge, prediktor cabang bimodal menggunakan satu bit kepercayaan untuk beberapa cabang, daripada satu bit kepercayaan untuk setiap cabang. Hasilnya, tabel histori cabang Anda akan memiliki jumlah bit yang sama yang mewakili lebih banyak cabang, yang akan menghasilkan perkiraan yang lebih akurat di masa mendatang.
Sandy Bridge: near the core
Dengan pertumbuhan prosesor multi-core, mengelola aliran data antara core dan memori telah menjadi topik penting. Kami telah melihat banyak cara berbeda untuk memindahkan data di sekitar CPU, seperti palang, ring, mesh, dan, kemudian, benar-benar memisahkan chip I / O. Pertempuran dekade berikutnya (2020+), seperti yang disebutkan sebelumnya oleh AnandTech, akan menjadi pertempuran koneksi internasional, dan sekarang sudah dimulai.
Salah satu fitur dari Sandy Bridge adalah CPU konsumen pertama dari Intel, yang menggunakan ring bus yang menghubungkan semua core, memori, cache level terakhir, dan grafik terintegrasi. Ini masih desain yang sama yang kita lihat dalam prosesor Coffee Lake modern.
Ring ring
Nehalem / Westmery Bridge menambahkan prosesor grafis dan mesin transcoding video ke chip yang berbagi cache L3. Dan alih-alih meletakkan lebih banyak kabel ke L3, Intel memperkenalkan ring bus.

Secara arsitektur, ini adalah bus ring yang sama yang digunakan di Nehalem EX dan Westmere EX. Setiap inti, setiap fragmen L3 cache (LLC), prosesor grafis terintegrasi, mesin media, dan agen sistem (nama lucu untuk jembatan utara) terhubung ke bus ring. : , , . 32 . .
L3, Westmere — 96 /. Sandy Bridge 4 , Westmere, , 384 /.
, L3 36 Westmere 26 — 31 Sandy Bridge ( , , ). , Westmere, - L3 — un-Core , Intel « », - L3. ( «un-Core» .)
- L3, , . , L3 , . L3, , L3 , . .
L3 , . Sandy Bridge L3, . , . Westmere , , Sandy Bridge . , . , , . , «», .
- Intel un-core SB, Sandy Bridge « ». (-, un-core , - ). . 16 PCIe 2.0, x8. DDR3, , , Lynnfield (Clarkdale ).

DMI, PCU ( ). SA , , .
Sandy Bridge
Sandy Bridge Westmere . 10-30%, Sandy Bridge , Intel Westmere (Clarkdale / Arrandale). 45 32 , IPC.
Sandy Bridge 32- , . . GPU . , .

GPU Sandy Bridge, - L3. , L3, , . , , , . .
SNB ( Gen 6) . : , , . – , , .

/ / (execution units), Intel EU. EU . ISA -- API DirectX 10, CISC- . - API IPC EU.
EU . EU, . Intel , , Westmere.
Intel « ». , . , , . , . Intel 64 80, , , 120 Sandy Bridge. - .

, EU.
GPU Sandy Bridge: 6 EU 12 EU. ( ) 12 EU, SKU 6 12 . Sandy Bridge Intel, , Intel , GPU. (2019 .) 24 EU (Gen 9.5), 10- ~ 64 EU (Gen11).
Sandy Bridge Media Engine
GPU Sandy Bridge -. SNB : .
: . Intel SNB, EU. Intel , SNB HD-.

Sandy Bridge. Intel ~ 3- 1080p 30 / iPhone 640 x 360. 14 400 .

/ . Sandy Bridge 3 2 / .
,
Lynnfield Intel, . , TDP 95 , , , -.
, - . , , — , .

Sandy Bridge , PCU TDP ( 25 ). PCU , . , , TDP. , , TDP, , , TDP. SNB TDP, PCU .

CPU, GPU Turbo . , GPU, SNB, CPU, GPU. , CPU, GPU CPU. Sandy Bridge , , .
Terima kasih telah tinggal bersama kami. Apakah Anda suka artikel kami? Ingin melihat materi yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikannya kepada teman-teman Anda,
diskon 30% untuk pengguna Habr pada analog unik dari server entry-level yang kami buat untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps dari $ 20 atau bagaimana membagi server? (opsi tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).
Dell R730xd 2 kali lebih murah? Hanya kami yang memiliki
2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV dari $ 199 di Belanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - mulai dari $ 99! Baca tentang
Cara Membangun Infrastruktur Bldg. kelas menggunakan server Dell R730xd E5-2650 v4 seharga 9.000 euro untuk satu sen?