Lebih banyak kopi, lebih sedikit kafein: Intel 9th ​​Gen (bagian 2)

Bagian 1 β†’ Bagian 2 β†’ Bagian 3 β†’ Bagian 4

Tes sistem



Bagian "Tes sistem" berfokus pada pengujian dalam kondisi nyata yang dihadapi konsumen, dengan sedikit bias dalam throughput. Pada bagian ini, kita akan melihat waktu pemuatan aplikasi, pemrosesan gambar, fisika sederhana, emulasi, pemodelan saraf, perhitungan yang dioptimalkan dan pengembangan model tiga dimensi menggunakan perangkat lunak yang mudah diakses dan dapat disesuaikan. Meskipun beberapa tes lebih mudah tumpang tindih dengan kemampuan paket besar seperti PCMark (kami menerbitkan nilai-nilai ini di bagian tes kantor), ada baiknya mempertimbangkan berbagai perspektif. Dalam semua tes, kami akan menjelaskan secara terperinci apa yang sedang diuji dan bagaimana tepatnya kami menguji.

Unduh Aplikasi: GIMP 2.10.4


Salah satu aspek terpenting dari pengalaman pengguna dan alur kerja adalah kecepatan sistem. Tes yang baik di sini adalah untuk memeriksa waktu pemuatan aplikasi. Sebagian besar program saat ini, ketika disimpan di SSD, mengunduh hampir secara instan, tetapi beberapa alat kantor memerlukan aset prapemuatan sebelum siap untuk digunakan. Sebagian besar sistem operasi juga menggunakan caching, sehingga ketika perangkat lunak tertentu sering diunduh (peramban web, alat kantor), ini dapat diinisialisasi lebih cepat.

Di suite tes sebelumnya, kami memeriksa berapa lama untuk memuat PDF besar ke Adobe Acrobat. Sayangnya, tes ini adalah mimpi buruk pemrograman, dan menolak untuk meningkatkan ke Win10 RS3 tanpa perlawanan. Sementara itu, kami menemukan aplikasi yang dapat mengotomatisasi tes ini, diputuskan untuk menggunakan GIMP, aplikasi pengeditan foto yang populer dan gratis. Ini adalah editor open source, alternatif utama untuk Adobe Photoshop. Kami mengkonfigurasinya untuk mengunduh templat desain berukuran besar 50 MB, melakukan pemuatan 10 kali dengan interval 10 detik di antaranya. Karena caching, hasil 3-5 pertama sering lebih lambat daripada yang lain, dan waktu caching mungkin tidak konsisten, jadi kami mengambil rata-rata dari lima hasil terakhir untuk menunjukkan pemrosesan CPU selama pemuatan dalam cache.



Pemuatan aplikasi, sebagai aturan, terbatas pada utas tunggal, tetapi jelas bahwa pada titik tertentu terbatas pada sumber daya kernel. Memiliki akses ke lebih banyak sumber daya per aliran (dalam lingkungan tanpa HT), prosesor 8C / 8T dan 6C / 6T berada di depan kedua prosesor 5,0 GHz dalam pengujian kami.

FCAT: pemrosesan gambar


Perangkat lunak FCAT dirancang untuk mendeteksi mikro-stick, menjatuhkan frame, dan menjalankan tes grafis ketika dua kartu video digabungkan bersama untuk membuat adegan. Karena mesin permainan dan driver grafis, tidak semua kombinasi GPU bekerja dengan sempurna, akibatnya perangkat lunak menangkap warna untuk setiap frame yang diberikan dan secara dinamis melakukan perekaman data RAW menggunakan perangkat video capture.



Perangkat lunak FCAT menerima video yang direkam, dalam kasus kami adalah 90 detik 1440p dari game Rise of the Tomb Raider, dan mengubah data warna menjadi data kerangka waktu, sehingga sistem dapat menampilkan frame rate yang "diamati" dan berkorelasi dengan konsumsi energi akselerator video. Tes ini, karena seberapa cepat itu selesai, adalah single-threaded. Kami memulai proses dan mendapatkan waktu penyelesaian sebagai hasilnya.



FCAT adalah skenario lain yang dibatasi oleh kinerja single-threaded, dan tampaknya prosesor generasi ke-9 yang baru tampil sangat baik di sini. 9700K dan 9900K memberikan waktu yang sama dengan perbedaan milidetik.

Gerakan Partikel 3D v2.1: Gerakan Brown


Tes 3DPM kami adalah patokan khusus yang dirancang untuk memodelkan enam algoritma berbeda untuk memindahkan partikel dalam ruang tiga dimensi. Algoritma dikembangkan sebagai bagian dari tesis Ph.D saya dan, pada akhirnya, bekerja paling baik pada GPU, dan memberikan ide yang bagus tentang bagaimana stream perintah ditafsirkan oleh berbagai mikroarsitektur.

Bagian utama dari algoritma adalah pembuatan angka acak - kami menggunakan generasi yang relatif cepat, yang melengkapi implementasi rantai ketergantungan pada kode. Pembaruan utama dibandingkan dengan versi primitif pertama dari kode ini adalah bahwa masalah Berbagi Salah dalam cache diselesaikan, yang merupakan hambatan utama. Kami juga mempertimbangkan untuk menerapkan versi AVX2 dan AVX512 dari pengujian ini untuk ulasan selanjutnya.



Untuk pengujian ini, kami menjalankan kumpulan stok partikel menggunakan enam algoritma berbeda, dalam waktu 20 detik, dengan jeda 10 detik, dan melaporkan kecepatan total partikel dalam jutaan operasi (pergerakan) per detik.



Berdasarkan kode non-AVX, 9900K menunjukkan IPC dan frekuensi yang sedikit lebih baik dibandingkan dengan R7 2700X, meskipun ini sebenarnya bukan persentase kenaikan yang besar seperti yang kita harapkan. Prosesor tanpa HT kalah dalam tes ini.

Tetapi ketika kita menggunakan AVX2 / AVX512, prosesor Skylake-X menemukan dirinya dalam elemen mereka. 9900K sekarang secara signifikan lebih unggul dari R7 2700X, bahkan lebih dari yang kami harapkan, Core i7-9700K juga ada di depan.

Dolphin 5.0: emulasi konsol


Salah satu tes yang diminta populer dalam paket kami adalah emulasi konsol. Kemampuan untuk memilih game dari sistem yang ketinggalan jaman dan menjalankannya sangat menarik, dan tergantung pada upaya emulator: diperlukan sistem x86 yang jauh lebih kuat untuk dapat secara akurat meniru konsol lama selain x86. Terutama jika kode untuk konsol ini dibuat dengan mempertimbangkan beberapa kelemahan fisik dan bug perangkat keras.

Untuk pengujian kami, kami menggunakan perangkat lunak emulasi Dolphin populer, menjalankan proyek komputasi melalui itu untuk menentukan seberapa akurat prosesor kami dapat meniru konsol. Dalam tes ini, emulasi Nintendo Wii akan bertahan sekitar 1050 detik.



Dolphin adalah skenario lain yang dibatasi oleh kinerja satu utas, itulah sebabnya prosesor Intel secara historis memimpin. Di sini, 9900K memintas 9700K hanya sesaat.

DigiCortex 1.20: Memodelkan otak siput laut


Tolok ukur ini awalnya dirancang untuk memodelkan dan memvisualisasikan aktivitas neuron dan sinapsis di otak. Perangkat lunak ini hadir dengan berbagai mode yang telah ditentukan, kami memilih patokan kecil yang mensimulasikan otak 32 ribu neuron / 1,8 miliar sinapsis, yang setara dengan otak siput laut.



Kami melaporkan hasil pengujian sebagai peluang untuk mengemulasi data dalam waktu nyata, sehingga setiap hasil di atas "unit" cocok untuk operasi waktu nyata. Dari dua mode, mode "tanpa start sinaps", yang sulit untuk DRAM, dan mode "dengan sinaps start", di mana prosesor dimuat, kami memilih yang terakhir. Terlepas dari pilihan kami, tes ini masih dipengaruhi oleh kecepatan DRAM.



DigiCortex sangat bergantung pada kinerja prosesor dan bandwidth memori, tetapi sepertinya Ryzen 6-core dapat dengan mudah bersaing dengan 8-core 9900K. The 8700K / 8086K tampaknya lebih baik dengan tes ini.

y-Cruncher v0.7.6: Perhitungan dioptimalkan untuk arsitektur mikro


Saya pernah mendengar tentang y-Cruncher sebagai alat untuk membantu Anda menghitung berbagai konstanta matematika. Tetapi setelah saya mulai berbicara dengan pengembangnya, Alex Yee, seorang peneliti NWU dan sekarang pengembang optimasi perangkat lunak, saya menyadari bahwa ia mengoptimalkan perangkat lunak dengan cara yang luar biasa untuk mendapatkan kinerja yang lebih baik. Secara alami, setiap simulasi yang memakan waktu 20+ hari akan mendapat manfaat dari peningkatan 1% dalam produktivitas! Alex mulai bekerja dengan y-Cruncher sebagai proyek di sekolah menengah, tetapi sekarang proyeknya mutakhir, Alex terus-menerus mengerjakannya untuk memanfaatkan set instruksi terbaru, bahkan sebelum mereka tersedia di tingkat perangkat keras.

Untuk pengujian kami, kami menjalankan y-Cruncher v0.7.6 melalui semua varian yang mungkin dioptimalkan dari perhitungan biner, single-threaded dan multi-threaded, termasuk file biner yang dioptimalkan untuk AVX-512. Tes ini untuk menghitung 250 juta karakter dari nomor Pi, dan kami menggunakan versi single-threaded dan multi-threaded dari tes ini.





Ketika y-cruncher mengambil keuntungan dari AVX2 / AVX512, kita melihat bahwa prosesor Skylake-X sekali lagi berangkat ke dunia mereka yang nyaman. Dalam mode multi-threaded, 9900K / 9700K membutuhkan 8 core untuk menyalip prosesor 6-core yang mendukung AVX512.

Agisoft Photoscan 1.3.3: Konversi Gambar 2D ke Model 3D


Salah satu ISV yang telah kami kerjakan selama beberapa tahun adalah Agisoft. Kampanye ini mengembangkan perangkat lunak yang disebut PhotoScan, yang mengubah serangkaian gambar 2D menjadi model 3D. Ini adalah alat penting dalam pengembangan dan pengarsipan model, dan bergantung pada sejumlah algoritma single-threaded dan multi-threaded untuk bergerak dari satu sisi perhitungan ke sisi lainnya.



Dalam pengujian kami, kami mengambil perangkat lunak versi 1.3.3 dengan kumpulan data besar - foto 84 x 18 megapiksel. Kami menjalankan tes sesuai dengan serangkaian algoritma yang cukup cepat, tetapi masih lebih ketat dari tes 2017 kami. Sebagai hasilnya, kami melaporkan total waktu penyelesaian proses.



Photoscan adalah tugas yang mengambil keuntungan maksimum dari throughput tinggi, kinerja single-threaded, dalam hal ini kehadiran HT adalah beban.

Tes Render


Dalam lingkungan profesional, rendering seringkali menjadi perhatian utama untuk beban kerja prosesor. Ini digunakan dalam berbagai format: dari rendering 3D ke rasterisasi, dalam tugas-tugas seperti game atau penelusuran ray, dan menggunakan kemampuan perangkat lunak untuk mengelola jerat, tekstur, tabrakan, alias, dan fisika (dalam animasi). Sebagian besar penyaji menawarkan kode untuk CPU, sementara beberapa menggunakan GPU dan memilih lingkungan yang menggunakan FPGA atau ASIC khusus. Namun, untuk studio besar, prosesor masih merupakan perangkat keras utama.

Corona 1.3: Render Kinerja


Penyaji yang ditingkatkan dioptimalkan untuk kinerja perangkat lunak seperti 3ds Max dan Cinema 4D, uji Corona menjadikan adegan yang dihasilkan dari versi 1.3 standar. Biasanya, penerapan tolok ukur GUI menunjukkan proses membangun adegan, dan memungkinkan pengguna untuk melihat hasilnya sebagai "waktu untuk menyelesaikan."



Kami menghubungi pengembang yang memberikan versi uji baris perintah kepada kami. Ini memberikan kesimpulan langsung dari hasilnya. Alih-alih melaporkan waktu adegan dibangun, kami melaporkan jumlah rata-rata sinar per detik selama enam kali berjalan, karena rasio tindakan yang diselesaikan untuk unit waktu secara visual lebih mudah dipahami.



Corona adalah tes multi-utas sepenuhnya, jadi prosesor tanpa HT sedikit ketinggalan. Core i9-9900K lepas landas, menyalip komponen 8-core AMD dengan margin 25 persen dan yang kedua setelah Threadripper 12-core.

Blender 2.79b: 3D Creation Suite


Sebagai alat rendering mutakhir, Blender adalah produk open source dengan banyak pengaturan dan konfigurasi dan digunakan oleh banyak studio animasi kelas atas di seluruh dunia. Organisasi baru-baru ini merilis suite uji Blender, beberapa minggu setelah kami memutuskan untuk mengurangi penggunaan tes Blender dalam paket baru kami, tetapi tes baru mungkin memakan waktu lebih dari satu jam. Untuk mendapatkan hasil kami, kami menjalankan salah satu subtests dalam paket ini melalui baris perintah - adegan standar "bmw27" dalam mode "CPU only", dan mengukur waktu penyelesaian rendering.



Blender memiliki campuran persyaratan eklektik, dari bandwidth memori ke kinerja mentah, tetapi, seperti di Corona, prosesor tanpa HT sedikit ketinggalan. Frekuensi tinggi 9900K menaikkannya di atas 10C Skylake-X dan AMD 2700X, tetapi tidak lebih tinggi dari 1920X.

LuxMark v3.1: LuxRender melalui berbagai jalur kode


Seperti yang dinyatakan di atas, ada banyak cara berbeda untuk memproses data rendering: CPU, GPU, Akselerator, dan lainnya. Selain itu, ada banyak kerangka kerja dan API di mana Anda dapat memprogram, tergantung pada bagaimana perangkat lunak akan digunakan. LuxMark, tolok ukur yang dikembangkan menggunakan mesin LuxRender, menawarkan beberapa adegan dan API yang berbeda.


diambil dari LuxMark versi Linux

Dalam pengujian kami, kami menjalankan adegan "Ball" sederhana menggunakan kode C ++ dan OpenCL, tetapi dalam mode CPU. Adegan ini dimulai dengan render kasar dan perlahan-lahan meningkatkan kualitas selama dua menit, memberikan hasil akhir dalam apa yang Anda sebut "rata-rata kilo per detik".





POV-Ray 3.7.1: penelusuran sinar


Mesin ray tracing Persistence of Vision adalah alat pembandingan lain yang terkenal yang melakukan hibernasi untuk beberapa waktu sampai AMD merilis prosesor Zennya ketika tiba-tiba Intel dan AMD mulai mendorong kode ke cabang utama proyek sumber terbuka. Untuk pengujian kami, kami menggunakan tes bawaan untuk semua core, dipanggil dari baris perintah.



Tes kantor


Office test suite dirancang untuk fokus pada tolok ukur industri yang lebih standar yang berfokus pada alur kerja kantor. Ini lebih banyak tes sintetis, tetapi kami juga menguji kinerja kompiler di bagian ini. Untuk pengguna yang perlu mengevaluasi peralatan secara keseluruhan, ini biasanya merupakan kriteria yang paling penting.

PCMark 10: Standar Industri


Futuremark, sekarang dikenal sebagai UL, telah mengembangkan tes yang telah menjadi standar industri selama dua dekade. Set tes sistem terakhir adalah PCMark 10, di mana beberapa tes ditingkatkan dibandingkan dengan PCMark 8, dan lebih banyak perhatian diberikan kepada OpenCL, khususnya dalam kasus-kasus seperti streaming video.

PCMark membagi nilainya menjadi sekitar 14 bidang yang berbeda, termasuk meluncurkan aplikasi, halaman web, spreadsheet, mengedit foto, rendering, konferensi video, dan fisika. Kami menerbitkan semua data ini dalam database Bench kami, tetapi skor keseluruhan adalah indikator utama untuk tinjauan saat ini.



Di sini, di mana banyak pengujian digabungkan, prosesor Intel yang baru menempati tiga posisi teratas secara berurutan. Bahkan i5-9600K berjalan di depan i7-8086K.

Kompilasi Chromium: Windows VC ++ Mengkompilasi Chrome 56


Sejumlah besar pembaca AnandTech adalah insinyur perangkat lunak yang mengawasi cara kerja perangkat keras. Meskipun mengkompilasi kernel Linux adalah "standar" untuk pengulas yang sering mengkompilasi, pengujian kami sedikit lebih beragam - kami menggunakan instruksi Windows untuk mengkompilasi Chrome, khususnya, Chrome build pada 56 Maret 2017, seperti ketika kami membuat pengujian. Google memberikan instruksi yang cukup rinci tentang cara kompilasi di bawah Windows setelah mengunduh 400.000 file dari repositori.



Dalam pengujian kami, mengikuti instruksi dari Google, kami menggunakan kompiler MSVC, dan ninja untuk mengontrol kompilasi. Seperti yang mungkin Anda harapkan, ini adalah tes dengan multithreading variabel, dan dengan persyaratan DRAM variabel yang mendapat manfaat dari cache yang lebih cepat. Hasil yang diperoleh dalam pengujian kami adalah waktu yang dihabiskan untuk kompilasi, yang kami konversi ke jumlah kompilasi per hari.

Performa frekuensi tinggi dari turbo full-blown tampaknya telah bekerja dengan baik dalam uji kompilasi kami.

3DMark Physics: menghitung fisika dalam game


Bersama dengan PCMark, ada benchmark 3DMark, Futuremark (UL) - serangkaian tes game. Setiap tes permainan terdiri dari satu atau dua adegan yang berat untuk GPU, serta tes fisik, tergantung pada saat tes ditulis dan platform apa yang ditargetkannya. Subjek utama, dalam kesulitan yang semakin meningkat, adalah Ice Storm, Cloud Gate, Sky Diver, Fire Strike dan Time Spy.

Beberapa subtes menawarkan opsi lain, seperti Ice Storm Unlimited (dirancang untuk platform seluler dengan rendering di luar layar), atau Fire Strike Ultra (dirancang untuk sistem 4K berkinerja tinggi dengan banyak fitur tambahan). Perlu dicatat bahwa Time Spy saat ini memiliki mode AVX-512 (yang dapat kita gunakan di masa depan).

Sedangkan untuk pengujian kami, kami mengirimkan hasil dari setiap tes fisik ke Bench, tetapi untuk review kami tetap berpegang pada hasil adegan yang paling menuntut: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra dan Time Spy.











Tes Ice Storm yang lebih lama tidak benar-benar menyukai Core i9-9900K baru, mendorongnya ke belakang R7 1800X. Untuk tes berorientasi PC yang lebih modern, 9900K menang. Kurangnya HT mencegah dua prosesor lain dalam garis menunjukkan hasil yang tinggi.

GeekBench4: Tes Sintetis


Alat umum untuk pengujian lintas platform pada perangkat seluler, PC, dan Mac, GeekBench 4 adalah tes sintetik sempurna dari suatu sistem menggunakan berbagai algoritma yang membutuhkan bandwidth maksimum. Pengujian meliputi enkripsi, kompresi, transformasi Fourier cepat, operasi memori, fisika n-body, operasi matriks, manipulasi histogram, dan penguraian HTML.





Saya memasukkan tes ini karena popularitas kueri, meskipun hasilnya sangat sintetik. Banyak pengguna sering mementingkan hasilnya karena fakta bahwa itu dikompilasi pada platform yang berbeda (walaupun dengan kompiler yang berbeda).
Kami mencatat peringkat dari subtests utama (Crypto, Integer, Floating Point, Memory) dalam database kami dari hasil pengujian, tetapi untuk review kami hanya mempublikasikan hasil single-threaded dan multi-threaded umum.

Tes enkode


, , . , , , , , , . , , .

Handbrake 1.1.0:


, Handbrake β€” , , , . . , AVX-512 OpenCL . , , CPU, .

Handbrake , - Logitech C920 1080p60 ( , ). . :

  • 720p60 at 6000 kbps constant bit rate, fast setting, high profile
  • 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
  • 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile







7-zip v1805:


/ 7-zip , . , . .







, : , . , , Windows Scheduler . , .

WinRAR 5.60b3:


, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .



WinRAR , , 10 , , .

AES:


, , . Windows BitLocker . AES discontinued TrueCrypt , .

, , β€” AES / , . AES , AVX-512.



-


low-end , small form factor , -, , . - , , - . , ( ) . , - : -, , . - , , , .

, .

WebXPRT 3: - ,


, XPRT, Principled Technologies, -, , , Β«3Β». ( , ) : , , , , HTML5, , .



, . , .

WebXPRT 2015: HTML5 Javascript Web UX


WebXPRT β€” 2015 , - , . - , , - , . - . , , , . β€” , . Β« Β», .



WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks


- β€” Speedometer 2, javascript, : , , . , , , -.

Β«rpmΒ», . .



Google Octane 2.0: Core Web Compute


- , , β€” Octane Google. 2.0 , , , , , β€” .

, . .



Mozilla Kraken 1.1: Core Web Compute


, Octane, Kraken, Mozilla. , , . , Kraken , , .

, . , .



3DPM v1: 3DPM v2.1


«» β€” 3DPM. , , , ( ). , , ( 4 , ; 5 – ).
(-O2, -fp: fast): OpenMP . , false sharing . , , .





x264 HD 3.0:


Tes transcoding ini sangat lama, Anandtech menggunakannya kembali pada zaman prosesor Pentium 4 dan Athlon II. Di dalamnya, video 720p standar dikodekan dengan konversi ganda, dan benchmark menunjukkan frame per detik dari setiap pass. Tes ini adalah single-threaded, dan dalam beberapa arsitektur kami mengalami pembatasan IPC - instruksi-per-jam.





Terima kasih telah tinggal bersama kami. Apakah Anda suka artikel kami? Ingin melihat materi yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikannya kepada teman-teman Anda, diskon 30% untuk pengguna Habr pada analog unik dari server entry-level yang kami buat untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps dari $ 20 atau bagaimana membagi server? (opsi tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps hingga 1 Januari gratis jika dibayar untuk jangka waktu enam bulan, Anda dapat memesan di sini .

Dell R730xd 2 kali lebih murah? Hanya kami yang memiliki 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV dari $ 249 di Belanda dan Amerika Serikat! Baca tentang Cara Membangun Infrastruktur Bldg. kelas menggunakan server Dell R730xd E5-2650 v4 seharga 9.000 euro untuk satu sen?

Source: https://habr.com/ru/post/id431158/


All Articles