
Kurang dari dua tahun setelah pengumuman, Intel memperkenalkan prosesor Intel Xeon Scalable generasi kedua pada arsitektur Cascade Lake yang baru. Secara resmi - 2 April. Perusahaan itu sendiri menyebutnya sebagai peluncuran terbesar dalam sejarahnya, secara strategis sangat penting untuknya. Baiklah, mari kita cari tahu apa yang istimewa dari Scalables baru ini.
Apa yang tersisa?
Prosesor Cascade Lake, atau lebih tepatnya Cascade Lake SP, seperti pendahulunya Skylake, masih termasuk dalam platform Purley, sekarang generasi kedua - Purley Refresh. Mereka sepenuhnya kompatibel dengan Skylake di tingkat konektor, chipset dan motherboard yang diwarisi dari generasi pertama. Tetapi dengan nuansa - misalnya, bios baru.
Teknologi proses tidak berubah. Namun 14 nm yang sama, dengan optimisasi.
Skema penamaan dan penamaan umum untuk seri Platinum, Emas, Perak, Perunggu tetap sama. Benar, ada lebih banyak "sufiks". Y, N, V, dan S baru ditambahkan ke L, M, dan T. yang ada. Dalam penomoran, nilai posisi kedua (ratusan) berubah: sekarang alih-alih persatuan, dua, yaitu, Emas 6240 akan menjadi penerusnya, misalnya, Emas 6140.
Jika tidak, karakteristik dasar dan serangkaian fitur tidak berubah. Jumlah inti dan ukuran cache memegang posisi: hingga 28 dan 1 MB L2 per inti + hingga 38,5 MB total L3. Jumlah dan jenis garis PCI-E sama seperti sebelumnya - 48 baris versi 3.0. Skalabilitasnya sama: hingga 3 jalur UPI per 10,4 GT / s dan hingga 8 soket (mulus) dalam sistem.
Apa yang kamu tambahkan?
Secara umum, ada banyak pembaruan mikro yang berbeda, tetapi saya akan memilih ini dari yang lebih atau kurang signifikan.
Pertama, Cascade Lake memperkenalkan tambalan perangkat keras terhadap kerentanan sensasional tahun lalu . Intel memperkenalkan solusi perangkat lunak dan perangkat keras terhadap opsi 2 (Spectre), 3, 3a dan 4 (Specter NG), L1TF (Foreshadow). Untuk Specter Variant 1, hanya patch perangkat lunak yang masih ditawarkan. Artinya, semua yang sudah ada di jajaran Intel Core i9. Dan itu terlihat dalam siaran pers:
- Opsi 1. Perlindungan dilakukan melalui OS dan VMM (Virtual Machine Monitor)
- Opsi 2. Hardware Branch Prediction Hardening (pencegahan serangan di masa depan dengan metode ini) + melalui OS dan VMM
- Opsi 3. Pengerasan Perangkat Keras
- Opsi 3a. Perangkat keras
- Opsi 4. Perangkat Keras + OS / VMM
- L1TF. Sudah ditutup berkat opsi Pengerasan Perangkat Keras 3
Kedua, dukungan untuk memori DDR4-2933 muncul. Tetapi dengan pemesanan: hanya untuk jalur Emas dan Platinum (Perunggu dan Perak masih bekerja dengan DDR4-2400) dan dengan hanya satu DIMM per saluran - dalam konfigurasi dengan dua DIMM per saluran, frekuensinya menurun menjadi 2666 MT / dtk.
Ketiga, Intel Optane DC Persistent Memory (DCPM) perdana. Kata-kata paling jelas tentang apa itu diperoleh oleh Tiskoma, jadi saya kutip:
"Intel Optane DC Persistent Memory (DCPM) adalah kelas teknologi baru yang menggabungkan konsep yang disebut" memori dan penyimpanan "untuk digunakan di pusat data."
Anda mungkin ingat bahwa Intel sebelumnya memperkenalkan Teknologi Intel Memory Drive untuk Xeon Skylake: Hypervisor (Xen) + Modul NVMe Optane. Kami bahkan memiliki tes pada subjek ini, tetapi hasilnya tidak inspirasional, dan kami memutuskan untuk menunggu solusi yang lebih mengesankan. Tampaknya telah menunggu =)
Inti dari solusi baru Intel adalah DCPMM yang secara visual mirip dengan DIMM, dan secara elektrik dan mekanis kompatibel dengannya. Mereka beroperasi pada kecepatan 2666 MT / s dan memiliki kapasitas 128/256/512 GB. Pada tingkat logis, mereka menggunakan protokol DDR4-T (Transaksi), yang, menurut Intel, disetujui oleh JEDEC, tetapi dalam praktiknya hanya didukung di pengontrol memori Cascade Lake. Yaitu, mereka memasang memori bebas energi yang dibuat menggunakan teknologi 3D XPoint pada konektor DDR4 DIM4, yang sekali lagi mengungguli NAND Flash yang tersebar luas dengan tiga urutan besarnya (1000 kali) dalam hal Intel, seperti kecepatan dan masa pakai.
Solusinya ternyata sangat menarik dan sangat ambigu: tentu saja, ada fitur operasi (bukan tanpa itu), harga, dan aplikasi. Tetapi kami tidak akan fokus pada fitur mematikan ini untuk jajaran prosesor ini - cerita yang lebih detail tentangnya jauh melampaui ruang lingkup artikel hari ini. Segera setelah tes dalam semua mode operasi yang memungkinkan teknologi ini siap, segera jalankan longrid :-)
Keempat, Teknologi Intel Resource Director (RDT), Speed Select (SST) dan Intel DL Boost telah dipompa melebihi keterampilan.Saya akan mulai dengan RDT. Ini mewakili mekanisme pemantauan dan kontrol yang agak baik atas pelaksanaan aplikasi dan penggunaan sumber daya. Potongan itu bukan barang baru, tetapi di baris ini mereka meletakkan tangan mereka dengan baik dan bekerja secara detail. Intinya adalah bahwa aplikasi dengan prioritas waktu yang lebih tinggi mendapatkan semua yang dibutuhkan. Secara alami, karena "pelanggaran hak" aplikasi lain.
Sekarang SST. Ini sama, tetapi pada tingkat nuklei: memungkinkan Anda untuk membedakan kelompok nukleus yang memiliki prioritas lebih tinggi daripada yang lain. Penampilan kali ini bukan debut, tetapi cukup spektakuler.
Dan untuk hidangan penutup, Intel DL Boost. Inovasi ini menyangkut serangkaian instruksi baru, yang sebelumnya dikenal sebagai Instruksi Jaringan Saraf Vektor (VNNI). Gizmo untuk AI, atau lebih tepatnya, untuk pelatihan jaringan pembelajaran mendalam yang lebih fleksibel. Bahkan, add-on lain di atas AVX-512.
Dan akhirnya, kelima. Menurut tradisi lama, ada lebih banyak frekuensi, lebih banyak core untuk penyegaran Intel :-) Baik frekuensi dasar dan frekuensi dalam dorongan telah tumbuh sebesar 200-300 MHz. Dengan beberapa pengecualian, dua core ditambahkan per prosesor. Jumlah RAM yang didukung telah meningkat.
Secara terpisah, perlu dicatat kerja Intel untuk mengoptimalkan penggunaan cache dan RAM, mungkin untuk meminimalkan dampak negatif tambalan dari kerentanan Spectre dan keluarga Meltdown.
Rincian lebih lanjut tentang arsitektur Cascade Lake dapat
ditemukan di wikichip . Saya sarankan membacanya. Dan sekarang - pengujian tradisional.
Pengujian
Pengujian melibatkan delapan prosesor Intel Xeon Scalable:
- generasi pertama - Perak 4110, Perak 4114, Emas 6130, Emas 6140
- generasi kedua - Perak 4210, Perak 4214, Emas 6230 dan Emas 6240.
Karakteristik kinerja platformSemua prosesor memiliki konfigurasi dasar yang sama.
- Platform: Intel Corporation S2600WFT (BIOS SE5C620.86B.02.01.0008.031920191559)
- RAM:
- Samsung DDR4-2933 16 GB - 12 unit (satu untuk setiap saluran) untuk prosesor Gold 6230 dan 6240
- Samsung DDR4-2666 16 GB - 12 unit (satu untuk setiap saluran) untuk prosesor Gold 6130 dan 6140
- Samsung DDR4-2400 16 GB - 12 unit (satu untuk setiap saluran) untuk prosesor Perak dari kedua generasi
- SSD: Intel DC S4500 480 GB - 2 buah dalam RAID1
- Konfigurasi prosesor ganda
Bagian perangkat lunak: CentOS Linux 7 x86_64 (7.6.1810)
Kernel: 3.10.0-957.12.2.el7.x86_64
Optimalisasi yang diperkenalkan terkait instalasi standar: opsi peluncuran kernel tambahan elevator = noop selinux = 0
Pengujian dilakukan dengan semua tambalan dari serangan Specter, Meltdown dan Foreshadow yang di-backport ke kernel ini.
Daftar tes yang akan kami lakukan:- Geekbench
- Sysbench
- Phoronix Test Suite
Deskripsi tes rinciTes GeekbenchPaket pengujian dilakukan dalam mode single-threaded dan multi-threaded. Hasilnya adalah indeks kinerja untuk kedua mode. Dalam tes ini, kami akan mempertimbangkan dua indikator utama:
- Skor Single-Core - tes single-threaded.
- Skor Multi-Core - tes multi-utas.
Satuan ukuran: abstrak "beo". Semakin banyak burung beo, semakin baik.
Tes SysbenchSysbench - paket tes (atau tolok ukur) untuk mengevaluasi kinerja berbagai subsistem komputer: prosesor, RAM, penyimpanan data. Tes ini multi-threaded, untuk semua core. Dalam tes ini, saya mengukur satu indikator: Kejadian kecepatan CPU per detik - jumlah operasi yang dilakukan oleh prosesor per detik. Semakin tinggi nilainya, semakin produktif sistemnya.
Phoronix Test SuitePhoronix Test Suite adalah test suite yang sangat kaya. Hampir semua tes yang disajikan di sini multithreaded. Hanya dua dari mereka yang merupakan pengecualian: tes single-threaded Himeno dan LAME MP3 Encoding.
Dalam tes ini, semakin tinggi nilainya, semakin baik.- Multithreaded John the Ripper passwords test. Ambil algoritma crypto Blowfish. Mengukur jumlah operasi per detik.
- Tes Himeno adalah pemecah tekanan Poisson linier menggunakan metode titik Jacobi.
- 7-Zip Compression - 7-Zip test menggunakan p7zip dengan fungsi pengujian kinerja terintegrasi.
- OpenSSL adalah seperangkat alat yang mengimplementasikan protokol SSL (Secure Sockets Layer) dan TLS (Transport Layer Security). Mengukur kinerja OpenSSL RSA 4096-bit.
- Apache Benchmark - tes ini mengukur berapa banyak permintaan per detik yang dapat ditahan oleh suatu sistem saat menjalankan 1.000.000 permintaan, sementara 100 permintaan dieksekusi secara bersamaan.
Dan dalam hal ini jika kurang, lebih baik - dalam semua tes waktu yang dibutuhkan untuk mengukur diukur.- C-Ray menguji kinerja CPU pada perhitungan floating point. Tes ini multi-threaded (16 thread per core), akan memotret 8 sinar dari setiap piksel untuk menghaluskan dan menghasilkan gambar 1600x1200. Waktu yang dibutuhkan untuk menyelesaikan tes diukur.
- Kompresi BZIP2 Paralel - Tes ini mengukur waktu yang dibutuhkan untuk mengkompres file (paket .tar dari kode sumber kernel Linux) menggunakan kompresi BZIP2.
- Pengkodean data audio. Tes Encoding MP3 LAME dilakukan dalam satu aliran. Waktu yang dibutuhkan untuk menyelesaikan tes diukur.
- Kompilasi GCC berjangka waktu. Memperlihatkan berapa lama waktu yang diperlukan untuk membangun kompiler GNU GCC (versi 8.2.0). Unit adalah detik.
Dalam pengujian ini, saya menghapus tes ffmpeg karena berhenti melewati jumlah total inti yang dimiliki emas modern dalam konfigurasi prosesor ganda.
Hasil tes


Dalam tes Geekbench dalam versi single-threaded dan multi-threaded, Scalable yang baru memotong yang lama dalam semua hal. Dalam tes single-threaded dari 3% menjadi 6%, di multi-threaded dari 6% menjadi 13%, dan pendewaan - Silver 4210 lebih baik daripada Silver 4110 sebanyak 33%.

Dalam tes Sysbench, perbedaannya adalah dari 22% menjadi 37%. Kesenjangan minimum antara Emas 6140 dan Emas 6240 adalah 7% mendukung yang baru.

Dalam tes tersebut, John The Ripper Silver 4210 menyalip Silver 4110 sebesar 41%, dan antara Silver 4214 dan Silver 4114 perbedaannya hampir 30% - tentu saja, lebih dulu daripada yang pertama. Sekarang emas. Emas 6230 adalah 16% lebih cepat dari Emas 6130. Kesenjangan minimum antara Emas 6140 dan Emas 6240 adalah 7,6%.

Perak 4210 menyalip Perak 4110 sebesar 29%, dan pendahulu Silver 4214 sebesar 23%. Kesenjangan antara pasangan Emas adalah 20% dan 8%, masing-masing.

Dalam tes Himeno single-threaded, Anda dapat melihat peningkatan bersih dari 200-300 MHz - dari 2,2% menjadi 6% mendukung generasi baru.

Tes kompres-7zip hampir sepenuhnya menyalin hasil uji John The Ripper: Blowfish. Kesenjangan yang indah antara Silver 4110 dan Silver 4210: 4210 hampir 35% lebih cepat dari pendahulunya. Perak 4214 dan Emas 6230 masing-masing 18% dan 20% lebih baik daripada 4114 dan 6130. Kesenjangan minimum antara Emas 6140 dan Emas 6240: yang baru adalah 4,7% lebih baik dari sebelumnya.

Dalam tes kompres-pbzip2, gambarnya mirip dengan tes kompres-7zip. Dari perbedaan yang signifikan, kesenjangan antara Emas 6130 dan Emas 6230 telah menyempit, ini dia 5,6%.

Dalam uji Encode-mp3 single-threaded, kita kembali melihat perbedaan 200-300 MHz. Dari 4% hingga 7% - Scalable generasi kedua jauh lebih baik daripada yang pertama dalam tes ini.

Dalam tes openssl, kesenjangan terbesar antara Silver 4110 dan Silver 4210 adalah 41%. Antara 4114 dan 4214 - 29%. Emas memiliki lebih sedikit. Antara Emas 6130 dan 6230 - 23%. Dan pada pasangan Emas 6140 dan 6240 - 4,6%. Saya perhatikan bahwa Gold 6240 hanya 0,78% lebih baik dari Gold 6230.

Dalam tes Apache, Silver 4210 lebih baik daripada Silver 4110 sebesar 40%, Silver 4214 menyalip Silver 4114 sebesar 36%, Emas 6230 lebih baik daripada Emas 6130 sebesar 21% dan Emas 6240 lulus tes ini lebih baik daripada Emas 6140 sebesar 29%. Saya terutama akan fokus pada Perak 4210, Perak 4214 dan Emas 6230: Emas 6230 adalah 3% lebih baik dari Perak 4210 dan 1,5% lebih baik dari Perak 4214. Artinya, kesenjangannya minimal. Emas 6240 adalah 13% lebih baik daripada Emas 6230.

Dalam tes GCC, generasi baru menyalip pendahulunya masing-masing sekitar 19%, 16%, 11% dan 9,5%.

Apa hasilnya
Kami mengamati kesenjangan yang signifikan antara Silver 4110 dan Silver 4210 - generasi baru lebih baik dari yang sebelumnya dalam tes multithreaded dari sekitar 20% hingga 40%. Terima kasih, frekuensi dan inti.
Sudah ada sedikit perbedaan antara Silver 4114 dan Silver 4214: test maksimum - dalam tes Apache mencapai 36%.
Lebih jauh, celah itu semakin menyempit. Emas 6230 menyalip Emas 6130 dalam kisaran dari 11% dalam tes GCC hingga 23% dalam tes OpenSSL.
Dan akhirnya, kesenjangan minimum antara pasangan Gold 6140 dan Gold 6240: yang baru adalah 3% -10% di depan yang sebelumnya sesuai dengan hasil sebagian besar tes. Pengecualian adalah tes Apache: perbedaannya adalah 28% - lebih sedikit inti, lebih banyak frekuensi dasar (Apache umumnya merupakan tes yang sangat menarik).
Dan sekarang kami lolos ke tes tambahan. Tapi pertama-tama, latar belakang singkat.
Pengujian RAM
Prosesor Intel Xeon Scalable Gold 62xx yang baru sekarang mendukung tipe baru DDR4-2933 RAM. Kami, secara logis, bertanya pada diri sendiri: seberapa besar frekuensi RAM akan memengaruhi kinerja sistem secara keseluruhan. Secara umum, berdasarkan asumsi bahwa plus to plus selalu memberikan sesuatu yang positif, diyakini bahwa prosesor baru yang dipasangkan dengan memori baru akan terbukti hebat. Tetapi itu adalah satu hal untuk diasumsikan, dan yang lain untuk memverifikasi secara eksperimental.
Untuk pengujian, kami mengambil prosesor Gold 6240 dalam konfigurasi prosesor ganda. Karakteristik kinerja platform dan komponen perangkat lunak tidak berubah. Kami akan menguji memori tersebut: DDR4-2400, DDR4-2666 dan DDR4-2933.
Selalu bahagia ketika ada semua yang Anda butuhkan untuk menguji hipotesis =) Dan sekarang mari kita lihat apa yang terjadi.
Hasil tes RAM
Ketika terlalu bagus, itu sudah buruk. Oleh karena itu, saya memutuskan untuk meninggalkan ide menggambar semua grafik dan membawa hasilnya ke tabel - lebih nyaman dan lebih cepat, meskipun kurang jelas. Bagan juga akan, tetapi hanya yang paling menarik, menurut saya.




"Entah kita melakukan sesuatu yang salah, atau salah satu dari dua hal."
Kutipan saudara Pilot, meskipun sedikit diparafrasekan, ternyata sangat berguna setelah pengujian memori selesai ...
Seperti dalam semua tes, kami mengambil sepuluh pengukuran dan memilih nilai rata-rata untuk mereka. Seperti yang dapat Anda lihat, kesaksian bervariasi seperti kesaksian warga Krolikova dari film Shirley-Myrli.
Dalam pengujian Phoronix 50 hingga 50 hasil tinggi menunjukkan konfigurasi dengan RAM 2400 dan 2933 MHz. Geekbench melakukan benchmark pada 2933 memori dengan parameter Memory Score_Single dan Memory Score_Multi, tetapi hasil keseluruhannya mengejutkan.
Dari asumsi - efek frekuensi yang lebih tinggi pada latensi. Dan inilah keseimbangan antara kecepatan dan waktu respons. Tapi, jujur saja, saya tidak yakin ... Jika Anda memiliki sesuatu untuk dikatakan tentang ini - saya bertanya di komentar.
Terakhir kali saya menjadi yakin bahwa tidak digunakannya semua saluran memori prosesor memberikan pengaruh yang lebih besar pada hasil pengujian. Dalam pengujian prosesor selanjutnya, kami pasti akan mempertimbangkan efek ini dan saya akan memberi tahu Anda apa dan bagaimana.
Langkah kecil bagi manusia, tetapi langkah besar bagi kemanusiaan
Seperti yang dikatakan Kamerad Kamnoedov (Saya suka Strugatsky), "kira-kira dalam penerimaan seperti itu" Intel memposisikan jajaran prosesor Xeon Scalable yang baru. Di awal artikel, saya mengatakan bahwa peluncuran Scalable baru untuk Intel sendiri merupakan langkah strategis yang penting. Sekarang saya akan jelaskan.
Di satu sisi, Scalable baru mengantarkan pembaruan global platform pusat data. Dan sudah di paruh kedua tahun ini beberapa pengumuman menarik menunggu kita. Di sisi lain, semua inovasi tidak disengaja - ini adalah jawaban terhadap tuntutan industri saat ini. Dan jawaban yang cukup layak. Memori tidak cukup? Berikut adalah Memori Persisten Optane DC. Ingin memprioritaskan perangkat keras untuk proses dan inti? Silakan memompa SST dan RDT. Pernahkah Anda memimpikan pelatihan jaringan profesional? :-) Di sini, tandatangani, set instruksi baru untuk AI. Untuk Intel Anda hanya dapat bersukacita.
Meskipun, secara pribadi, menurut saya rilis ini termasuk Wishlist, yang tidak berhasil diimplementasikan oleh Intel sebelumnya. Dan, tentu saja, sesuatu harus dilakukan dengan lubang perangkat keras, pencarian yang untuk spesialis yang berbeda telah menjadi semacam hiburan. Segala sesuatu yang Intel ambil dari pengguna dengan lubang Spectrum-Meltowna, dia sekarang kembali, menghemat harganya.
Selain itu, AMD datang dari segala arah, yang keputusannya tidak terlalu terpengaruh oleh Spectrum-Meltdowns, dan yang baru-baru ini secara khusus “mengguncang” Intel seperti pada desktop (saya ingin memiliki keremajaan seperti itu di usia yang terhormat), dan sedikit di segmen server. Ngomong-ngomong, dalam hal yang terakhir, sangat menarik untuk melihat bagaimana AMD Epyc Rome yang baru akan tampil sendiri, karena generasi Epyc saat ini secara pribadi tidak membuat saya acuh tak acuh.
Tapi kembali ke Scalable.
Apa intinya bagi pengguna yang tidak dibebani oleh AI dan jaringan terlatih? Jelas peningkatan produktivitas yang jelas karena jumlah inti yang lebih besar, frekuensi basis yang lebih tinggi, dan frekuensi turbo boost. Dan jika untuk prosesor Emas dari generasi yang berbeda peningkatan ini mencapai maksimum 23% - keduanya baik, maka untuk Perak dalam beberapa tes mencapai 40%. Mengingat nilai yang hampir tidak berubah, perbedaannya cukup menyenangkan, meskipun seperti biasa saya ingin lebih =)
Jika Anda mengandalkan pernyataan Intel bahwa ini hanyalah permulaan, bahkan orang skeptis seperti saya ingin tahu apa yang akan menarik bagi kami di masa mendatang.
Dalam pengujian, kami menggunakan server berdasarkan prosesor Intel Xeon Scalable: Silver 4110, Silver 4114,
Silver 4210 ,
Silver 4214 , Gold 6130, Gold 6140,
Gold 6230 ,
Gold 6240 .
Hingga 25 Juli, server dengan Xeon Scalable baru dapat dipesan di situs web
1dedic.ru dengan diskon 25% selama 1 bulan
menggunakan kode promosi NEW_SCALABLE . Kode promosi akan dibakar pada tengah malam pada tanggal 26 Juli 2019.
Untuk server khusus, diskon 10% saat membayar untuk tahun tersebut.
Diuji dan ditulis untuk Anda oleh Trashwind , administrator sistem senior dari departemen operasi FirstDEDIC