
Kemarin, 04/02/2019, Intel mengumumkan pembaruan yang telah lama ditunggu-tunggu untuk keluarga Intel® Xeon® Scalable Processors, yang diperkenalkan pada pertengahan 2017. Prosesor baru didasarkan pada arsitektur mikro, nama kode Cascade Lake dan dibangun di atas proses 14-nm yang ditingkatkan.
Fitur prosesor baru

Pertama, lihat perbedaan dalam pelabelan. Dalam artikel sebelumnya tentang Skylake-SP, kami telah menyebutkan bahwa semua prosesor dibagi menjadi 4 seri -
Perunggu ,
Perak ,
Emas dan
Platinum . Digit pertama dari nomor tersebut memberitahukan seri mana yang dimiliki oleh model prosesor:
- 3 - Perunggu,
- 4 - Perak,
- 5, 6 - Emas,
- 8 - Platinum.
Digit kedua menunjukkan generasi prosesor. Untuk keluarga Prosesor Intel® Xeon® Scalable, generasi yang diberi nama kode:
- 1 - Skylake,
- 2 - Danau Cascade.
Dua digit berikutnya menunjukkan apa yang disebut SKU (Stock Keeping Unit). Bahkan, ini hanya pengidentifikasi CPU dengan serangkaian fungsi tertentu yang tersedia.
Selain itu, setelah nomor model, mungkin ada indeks yang dilambangkan dengan satu atau dua huruf. Huruf pertama indeks menunjukkan fitur arsitektur atau optimalisasi prosesor itu sendiri, dan yang kedua - kapasitas memori pada soket.
Misalnya, ambil prosesor berlabel
Intel® Xeon® 6240 . Dekripsi:
- 6 - Prosesor seri emas,
- 2 - generasi Cascade Lake,
- 40 - SKU.
Performa
Prosesor generasi baru dirancang dengan harapan dapat digunakan dalam bidang virtualisasi, kecerdasan buatan, serta komputasi kinerja tinggi. Perubahan pertama yang terlihat adalah peningkatan frekuensi clock. Ini cukup diharapkan, karena ada sejumlah besar aplikasi server yang kecepatan clock lebih penting daripada jumlah core prosesor. Misalnya, produk keuangan 1C, persyaratan sistem yang dengan jelas mengatakan bahwa semakin tinggi frekuensi prosesor, semakin cepat pengguna akhir akan mendapatkan hasilnya.
Dalam beberapa kasus, jumlah core meningkat. Untuk lebih jelasnya, kami telah menyusun tabel perbandingan beberapa prosesor dari keluarga Prosesor Intel® Xeon® Scalable generasi pertama dan kedua:
Peningkatan frekuensi clock pasti menyebabkan peningkatan disipasi panas. Untuk prosesor andalan dari seri Platinum, dapat mencapai
205W , yang merupakan tes yang sangat serius untuk sistem pendingin udara tradisional. Dapat diasumsikan bahwa di masa mendatang, platform server akan membutuhkan pendinginan cair.
Seperti pada Skylake SP generasi sebelumnya, prosesor dipasang di soket
LGA3647 (Socket P), yang disebabkan oleh penggunaan pengontrol memori 6-saluran (hingga maksimal 2 modul memori per saluran). Frekuensi memori adalah
2666 MT / s , namun saat menggunakan prosesor dari seri 6000 dan 8000, Anda dapat menggunakan memori dengan frekuensi
2933 MT / s (tidak lebih dari 1 modul per saluran).

Bus
Ultra-Path Interconnect , yang berhasil digunakan dalam prosesor Intel Xeon SP generasi pertama, tetap berada di generasi kedua, menyediakan pertukaran data antara prosesor dengan kecepatan 9,6 GT / s atau 10,4 GT / s untuk setiap saluran. Ini memungkinkan Anda untuk mengukur platform perangkat keras secara efektif hingga 8 prosesor fisik, mengoptimalkan bandwidth dan efisiensi energi.
Tes
Kami mulai menguji prosesor generasi baru dengan bantuan paket uji
SPEC , yang mensimulasikan beban berdasarkan solusi dari tugas-tugas kehidupan yang paling mendesak. Tes-tes ini mewakili perhitungan paling sederhana dan perhitungan berbagai proses fisik, misalnya, memecahkan masalah fisika molekuler dan hidrodinamika.
Saat ini, kami telah menyiapkan hasil beberapa tes SPEC untuk perhitungan bilangan bulat menggunakan prosesor Intel® Xeon® Gold 6140 dan Intel® Xeon® Gold 6240 sebagai contoh.
Deskripsi tes- perlbench_r adalah versi singkat dari bahasa Perl. Beban uji meniru kerja dari sistem anti-spam SpamAssassin yang populer;
- deepsjeng_r - simulasi permainan catur. Server melakukan studi mendalam tentang posisi game menggunakan algoritma kliping alpha-beta;
- leela_r - simulasi gim yang sedang berjalan. Dalam proses pengujian, ada analisis pola pergerakan, serta pencarian selektif di pohon berdasarkan batas kepercayaan atas;
- exchange2_r - generator teka-teki sudoku non-sepele. Ditulis dalam Fortran 95, ia menggunakan sebagian besar fungsi pemrosesan array;
- kompiler bahasa gcc_s C. Beban uji “mengkompilasi” kompiler GCC dari kode sumber untuk arsitektur mikroprosesor IA-32.
Menurut hasil pengujian, menjadi jelas bahwa prosesor generasi baru melakukan perhitungan bilangan bulat lebih cepat dari generasi sebelumnya. Kami akan membagikan hasil tes lain di salah satu artikel berikut.
Intel® Optane ™ DC Persistent Memory Support
Mempercepat beban kerja dari database dan aplikasi yang sangat banyak - inilah yang diharapkan semua pelanggan dari pembaruan yang akan datang. Oleh karena itu, inovasi utama adalah dukungan untuk Intel® Optane ™ DC Persistent Memory, lebih dikenal dengan nama kode Apache Pass.

Memori ini dirancang untuk menjadi solusi universal untuk masalah ketika menggunakan jumlah DRAM yang tepat secara ekonomi tidak menguntungkan, dan karakteristik kecepatan bahkan SSD andalannya tidak cukup.
Contoh nyata adalah penempatan basis data langsung di Intel® Optane ™ DC Persistent Memory, yang menghilangkan kebutuhan untuk pertukaran data yang konstan antara RAM dan perangkat penyimpanan (fitur yang melekat dalam sistem tradisional).
Jenis memori baru dipasang langsung di slot DIMM dan sepenuhnya kompatibel dengannya. Modul dengan volume berikut tersedia:
Volume modul yang signifikan akan memungkinkan Anda untuk secara fleksibel mengkonfigurasi platform perangkat keras, setelah menerima ruang disk yang sangat luas dan sangat cepat untuk sistem yang sangat dimuat. Intel® Optane ™ DC Persistent Memory memiliki potensi yang sangat besar untuk aplikasi, termasuk pembelajaran mesin.
Pembelajaran yang lebih cepat
Selain mendukung memori jenis baru, para insinyur Intel berupaya mempercepat proses pembelajaran mendalam. Karena jaringan saraf convolutional sering membutuhkan multiplikasi multipel dari nilai 8 dan 16 bit, prosesor baru ini menerima dukungan untuk instruksi
AVX-512 VNNI (Vector Neural Network Instructions). Ini akan memungkinkan Anda untuk mengoptimalkan dan mempercepat perhitungan beberapa kali.
Efisiensi terbaik dicapai dengan menerapkan serangkaian instruksi berikut:
- VPDPBUSD (untuk perhitungan INT8),
- VPDPWSSD (untuk perhitungan INT16).
Intinya adalah untuk mengurangi jumlah barang yang diproses per siklus. Instruksi
VPDPWSSD menggabungkan dua instruksi INT16 dan juga menggunakan konstanta INT32 untuk menggantikan dua instruksi saat ini
PMADDWD dan
VPADDD . Instruksi
VPDPUSB juga mengurangi jumlah elemen dengan mengganti tiga instruksi yang ada
VPMADDUSBW ,
VPMADDWD, dan
VPADDD .
Dengan demikian, dengan aplikasi yang benar dari set instruksi yang baru, adalah mungkin untuk mengurangi jumlah elemen yang diproses per siklus hingga dua hingga tiga kali dan meningkatkan kecepatan pemrosesan data. Kerangka kerja yang sesuai untuk instruksi baru akan menjadi bagian dari perpustakaan perangkat lunak pembelajaran mesin seperti:
Optimasi penyeimbangan beban
Pemuatan sumber daya komputasi yang seragam menjadi lebih mudah dengan Intel® Speed Select Technology (pada prosesor dengan indeks Y). Intinya adalah bahwa setiap operasi mulai dikaitkan dengan jumlah core yang terlibat dan kecepatan clock. Bergantung pada profil yang dipilih dari setiap operasi, sumber daya dialokasikan sebagai berikut:
- lebih banyak core, tetapi dengan kecepatan clock yang lebih rendah;
- lebih sedikit core, tetapi dengan peningkatan kecepatan clock.
Pendekatan ini memungkinkan Anda untuk sepenuhnya memanfaatkan sumber daya, yang sangat penting saat menggunakan lingkungan tervirtualisasi. Ini akan mengurangi biaya dengan mengoptimalkan beban pada host virtualisasi.
Akselerasi Komputasi Ilmiah
Memproses data ilmiah, terutama ketika memodelkan proses fisik pada tingkat partikel (misalnya, menghitung interaksi elektromagnetik) membutuhkan sejumlah besar komputasi paralel. Masalah ini dapat diselesaikan dengan menggunakan CPU, GPU atau FPGA.
CPU multi-core bersifat universal karena banyaknya alat perangkat lunak dan pustaka untuk pemrosesan data. Menggunakan GPU untuk keperluan ini juga sangat efektif, karena Anda dapat menjalankan ribuan utas paralel langsung pada inti grafis perangkat keras. Ada kerangka kerja yang nyaman untuk pengembangan, seperti OpenCL atau CUDA, yang memungkinkan Anda membuat aplikasi dengan kompleksitas apa pun menggunakan
komputasi GPU .
Namun, ada alat perangkat keras lain yang sudah kita bicarakan
di artikel sebelumnya - FPGA. Kemampuan untuk memprogram perangkat semacam itu untuk melakukan perhitungan tertentu memungkinkan Anda untuk mempercepat pemrosesan data, melepaskan sebagian CPU. Skenario yang sama dapat diterapkan pada prosesor Cascade Lake baru bersama dengan Intel® Stratix® 10 SX FPGAs.
Meskipun kecepatan clock lebih rendah dibandingkan dengan CPU konvensional, FPGA mampu menunjukkan kinerja sepuluh kali lebih tinggi. Untuk beberapa jenis tugas, seperti pemrosesan sinyal digital, Intel® Stratix® 10 SX dapat menampilkan hasil hingga 10 TFLOPS (operasi titik mengambang tera per detik).
Penskalaan platform
Melakukan bisnis secara real time tidak hanya menyiratkan stabilitas, tetapi juga kemampuan untuk meningkatkan permintaan. Contoh yang baik adalah platform SAP HANA berkinerja tinggi yang digunakan untuk penyimpanan dan pemrosesan data. Penyebaran fisik platform ini membutuhkan sumber daya perangkat keras yang sangat kuat.
Prosesor Intel® Xeon® Scalable dirancang untuk mengubah sistem multi-socket menjadi elemen inti dari infrastruktur TI, memberikan skalabilitas untuk memenuhi tuntutan aplikasi bisnis.

Ini diimplementasikan dalam bentuk dukungan untuk pengontrol Node eksternal, yang memungkinkan Anda membuat konfigurasi tingkat yang lebih tinggi daripada yang dapat disediakan oleh satu platform. Misalnya, Anda dapat membuat konfigurasi 32 prosesor fisik dengan menggabungkan sumber daya dari beberapa platform multi-soket menjadi satu kesatuan tunggal.
Kesimpulan
Peningkatan frekuensi operasi dan inti prosesor, peningkatan produktivitas, dan dukungan untuk Intel® Optane ™ DC Persistent Memory - semua peningkatan ini secara signifikan meningkatkan daya komputasi setiap platform, mengurangi biaya jumlah peralatan yang digunakan dan meningkatkan efisiensi pemrosesan data. Prinsip skalabilitas, yang ditetapkan pada tingkat arsitektur, memungkinkan Anda membangun infrastruktur TI dengan kompleksitas apa pun dan mencapai kinerja tinggi serta efisiensi energi.
Karena Selectel adalah mitra Intel Platinum, pelanggan kami
sekarang dapat memesan prosesor Intel® Xeon® Scalable generasi berikutnya di server konfigurasi yang sewenang-wenang.
Menyewa server dengan prosesor generasi baru itu mudah! Cukup buka
halaman konfigurator dan pilih komponen yang diperlukan. Setiap pertanyaan tentang pengoperasian layanan dapat ditanyakan kepada spesialis kami dengan
membuat tiket di panel kontrol. Membayar server selama beberapa bulan sebelumnya, Anda mendapatkan diskon hingga 15%.
Jika Anda tertarik untuk berpartisipasi dalam menguji teknologi terbaru,
bergabunglah dengan Selectel Lab kami.
Kami akan senang mendengar pertanyaan dan saran Anda di komentar.