Monster setelah liburan: AMD Threadripper 2990WX 32-Core dan 2950X 16-Core (bagian 4)

Bagian 1 β†’ Bagian 2 β†’ Bagian 3 β†’ Bagian 4 β†’ Bagian 5

Konsumsi Daya, TDP dan Prime95 vs POV-Ray


Bagi sebagian besar dari kita, daya prosesor sekitar 15 watt pada laptop dan 65-95 watt pada sistem desktop. Prosesor desktop berkinerja tinggi selalu lebih rakus, dan karenanya TDP 130 W dan 140 W adalah indikator normal bagi mereka. Ketika AMD merilis prosesor 220 W pada platform Vishera lama, setelah overclock Core Bulldozer menjadi 5,0 GHz, pemikiran itu merayap apakah AMD benar-benar gila: banyak motherboard yang kompatibel dengan soket AMD, tetapi untuk menggunakan TDP 220 W dan lebih tinggi harus merilis sejumlah motherboard baru. Saat ini, prosesor Intel yang paling kuat di pasaran memiliki TDP resmi sebesar 205 watt, tetapi AMD telah melangkah lebih jauh dengan menaikkan standar menjadi 250 watt.



Dua prosesor WX baru, 32-core 2990WX dan 2970WX, diberi nilai 250 watt. Di kedua prosesor, keempat matriks silikon aktif, ada enam jalur Infinity Fabric aktif. Prosesor ini dirancang untuk mencapai tingkat kinerja baru, sementara AMD menunjukkan slide dengan frekuensi turbo pada semua core 3,6 GHz. Dua prosesor yang datang untuk menggantikan X-series memiliki kekuatan 180 watt, serta prosesor Threadripper generasi pertama.

Namun, tidak semua TDP sama. Cara Intel dan AMD mengukur TDP telah berubah selama bertahun-tahun dan sekarang sangat jauh dari kenyataan. Biarkan saya jelaskan.

TDP adalah lelucon


Nilai TDP, atau daya desain termal, bukan merupakan indikator konsumsi energi. Secara teknis, ini adalah indikator kinerja pendingin, yang berarti bahwa untuk mengatasi pekerjaannya, pendingin harus memiliki tingkat TDP yang sama. Konsumsi energi aktual harus sedikit lebih tinggi - perpindahan panas dari prosesor ke soket dan dari soket ke motherboard berkontribusi terhadap pendinginan, tetapi tidak diperhitungkan dalam indikator TDP. Seringkali, laju disipasi panas TDP dan konsumsi daya prosesor dianggap sebagai satu, karena perbedaannya tidak signifikan.

Mari kita mulai perhitungan dengan prosesor AMD. Perhitungan AMD TDP didasarkan pada formula sederhana:

TDP = (Suhu pengoperasian, dalam Celcius - suhu idle, dalam Celcius) / Daya termal pendingin

Dengan demikian, ketika AMD menentukan TDP prosesor Ryzen 7 2700X dengan suhu beban sekitar 62 Β° C, suhu idle 42 Β° C dan pendingin dengan daya termal 0,189 C per watt (Wraith Max), kami mendapatkan nilai sekitar 105W.

Formula AMD memiliki dua masalah sekaligus: pertama, suhu prosesor yang dimuat dapat dikontrol menggunakan pendingin atau aliran udara eksternal, dan kedua, hasilnya sangat dipengaruhi oleh kekuatan termal pendingin. Dengan pendingin cairan besar yang memiliki daya termal lebih tinggi, misalnya, 0,400 C per watt, TDP nominal prosesor apa pun akan lebih rendah: dalam kasus Ryzen 7 2700X, TDP-nya hanya 50 watt. Peringkat TDP dan konsumsi daya tidak sama, dan rasio mereka dapat berubah ke segala arah, hanya AMD yang harus memilih pendingin yang berbeda untuk perbandingan.

Versi TDP Intel sedikit lebih rumit, tetapi apakah ini masuk akal ... Intel menentukan TDP dari prosesornya hanya untuk frekuensi dasar, mengabaikan frekuensi turbo. Akibatnya, jika Intel merilis prosesor dengan TDP 95 W, frekuensi dasar 3,2 GHz, turbo single-core 4,7 GHz dan turbo penuh 4,2 GHz, maka konsumsi daya dijamin 95 W akan berada pada frekuensi dasar 3,2 GHz. Ini berarti bahwa pada setiap motherboard yang menggunakan turbo (yaitu, pada umumnya pada setiap), prosesor akan mengkonsumsi lebih banyak daya di bawah beban apa pun daripada TDP resminya.

Dan ini sangat menyebalkan. Langkah pemasaran Intel adalah mengiklankan prosesor turbo single-core dan tidak mempublikasikan nilai yang lebih rendah untuk turbo "all-core". Kami diberitahu bahwa ini adalah "informasi internal perusahaan" yang termasuk dalam perjanjian non-pengungkapan. Dalam setiap kasus, setiap prosesor yang memiliki frekuensi turbo "all-core" di atas frekuensi dasar akan mengkonsumsi di atas TDP yang ditentukan.

Contoh yang baik adalah Core i7-8700 dan TDP 65 W-nya. Ini memiliki frekuensi dasar 3,2 GHz, turbo single-core 4,6 GHz dan turbo penuh 4,3 GHz. Jika kita memuat lebih banyak aliran dan membatasi konsumsi energi hingga 65 W, maka kita mendapatkan yang berikut:



Apakah layak untuk menganggap serius nilai-nilai TDP? Perlakukan mereka dengan humor.

Konsumsi daya


Ada beberapa cara untuk mengukur konsumsi daya prosesor. Cara termudah adalah dengan menggunakan alat pengukur, yang akan memungkinkan Anda untuk mengetahui konsumsi daya seluruh sistem, termasuk kerugian dalam sistem catu daya motherboard. Metode rumit melibatkan menghubungkan alat yang diperlukan ke papan untuk mengukur arus melalui konektor 12-volt, mengukur tegangan prosesor menggunakan pengaturan overclocking pada beberapa motherboard. Cara ketiga adalah membaca register perangkat keras menggunakan perangkat lunak yang sesuai.

Register membaca adalah pedang bermata dua. Pertama, Anda mengandalkan dimensi internal, yang sering memiliki margin kesalahan yang cukup lebar. Kedua, Anda mengandalkan produsen prosesor untuk melaporkan data sebenarnya tentang prosesor Anda. Ini tidak selalu masuk akal (!). Di sisi positifnya: adalah mungkin untuk mendapatkan lebih banyak informasi dari prosesor, misalnya, analisis daya untuk setiap inti, daya DRAM, daya IO / Interconnect, daya grafis terintegrasi, mendapatkan pemahaman umum tentang distribusi daya.

Register perangkat keras - ini adalah cara di mana sistem memberi tahu dirinya sendiri data tentang pekerjaan: berapa banyak energi yang digunakan, bagaimana seharusnya mengatur tegangan / frekuensi tergantung pada arus, daya atau kinerja termal. Sisi positif lainnya adalah kemudahan penggunaan data tersebut dalam skrip uji.

Pengujian energi sering menjadi subjek kontroversi. Virus khusus biasanya digunakan yang dapat secara bersamaan memuat setiap area prosesor dengan daya maksimum. "Power virus" digunakan untuk memeriksa stabilitas akselerasi, tetapi ia memiliki satu kelemahan: dengan beban harian, hasilnya, sebagai suatu peraturan, tidak mencerminkan konsumsi daya yang sebenarnya. Ini adalah garis tipis antara tes nyata dan tes sintetis yang dirancang untuk mendorong setiap joule energi melalui chip. Perangkat lunak, seperti LINPACK, sering digunakan sebagai tes daya yang efektif. Alat internal Intel dan AMD dapat membantu memuat chip lebih keras.

Prime95 adalah alat yang populer, sangat dioptimalkan untuk hampir setiap inti, ia mengendalikan catu daya. Beban kerjanya semi-sintetik, berdasarkan perhitungan bilangan prima, tetapi tes stres mengabaikan hasil dan hanya berfokus pada konsumsi energi. Selama ulasan ini, kami bermain sedikit dengan POV-Ray sebagai tes daya: ia memberikan konsumsi daya yang lebih tinggi daripada Prime95, dan juga menggunakan beban penelusuran ray yang sangat populer. Untuk menulis ulasan untuk saya, itu sebabnya saya memutuskan alat mana yang paling baik digunakan untuk tes konsumsi energi. Prime95 memiliki masalah dalam bekerja dengan sejumlah besar core (kadang-kadang sulit untuk mendapatkan hasil tes jika batas 25 thread terlampaui), dan untuk membuat POV-Ray bekerja, kita harus menyesuaikan metode bebannya, karena lebih ditujukan untuk memeriksa beban kernel, daripada ditujukan untuk memeriksa beban kernel, daripada stream. Namun, kami berharap mendapatkan hasil tergantung pada jumlah utas. Akan ditunjukkan perangkat lunak apa yang digunakan pada setiap tahap pengujian (kami dapat menyiapkan versi POV-Ray kami hanya di tengah tinjauan, oleh karena itu sebagian besar data diterima dari Prime95).

Konsumsi daya total


Sebagai rangkaian hasil pertama, saya ingin menyajikan total konsumsi daya prosesor, diukur dalam berbagai situasi. Saat idle:



Kemudian kami hanya memuat satu inti dengan dua utas menggunakan Prime95. Teknik pengujian kami membuat kedua thread bekerja pada core yang sama, jika core prosesor mampu memproses beberapa thread. Pengguna yang berfokus pada beban tugas tunggal akan melihat konsumsi energi dalam kisaran ini. Ini juga berlaku untuk sistem di mana Windows selalu berada di latar belakang.



Tes ketiga adalah sistem yang dimuat dengan empat utas menggunakan Prime95. Ini persis kisaran beban yang kebanyakan orang gunakan setiap hari pada sistem mereka: beberapa tab browser, beberapa jendela, beberapa paket perangkat lunak yang terbuka, satu atau beberapa permainan sedang berjalan.



Meningkatkan beban prosesor menjadi dua belas utas (dengan Prime95), kami beralih ke pengguna menggunakan beban kerja besar dan multi-tasking. Ini adalah gamer - streamer, atau pengguna yang mulai melakukan render saat bekerja secara paralel dengan tugas lain.



Grafik terakhir menunjukkan konsumsi daya total. Untuk pengujian ini kami menjalankan jumlah maksimum utas (Prime95), di masa mendatang kami berencana untuk menggunakan POV-Ray untuk pengujian ini, karena ini menunjukkan dirinya jauh lebih baik dengan jumlah utas yang tinggi. Satu-satunya kelemahan dari tes ini adalah bahwa 2990WX yang di-overclock dapat menyelesaikan tes POV-Ray dalam waktu kurang dari 20 detik.



Konsumsi daya inti individu


Sebelum membuat uji konsumsi daya POV-Ray, saya meluncurkan kedua prosesor Threadripper baru pada pengujian Prime95 di opsi All-thread, menerima konsumsi daya dari masing-masing inti pada setiap beban.



Saat memuat inti pertama, kita melihat bahwa konsumsi dayanya ~ 23 watt. Ini jauh dibandingkan dengan inti Zeppelin. Ini juga berlaku ketika dua core dimuat. Dengan memuat tiga core, kami mengamati penurunan konsumsi hingga 18,8 watt per inti. Mengingat bahwa chip ini memiliki empat CCX, muncul pertanyaan apakah hasil ini terkait dengan fakta bahwa stream dimuat ke CCX yang sama (yang, tampaknya, harus terjadi), dan kami mencapai batas daya CCX. Saat memuat empat inti, konsumsi setiap inti sekitar 17,4 watt.

Meningkatkan jumlah core yang dimuat menjadi lima, kami menemukan bahwa inti kelima bekerja pada 18,2 watt, dan sisanya empat - pada 16,8 watt. Hasilnya menunjukkan bahwa inti kelima ini terletak di CCX baru. Dalam transisi dari delapan inti ke sembilan, kita melihat hal yang sama: inti kesembilan mengkonsumsi daya 17,5 watt, sedangkan delapan sisanya sekitar 14,3 watt. Pada akhirnya, distribusi daya turun menjadi 7-9 watt per inti jika kita menggunakan semua 16 core.

Konsumsi daya total prosesor adalah ~ 178 W, sekitar 180 W TDP dengan konsumsi ~ 135 W pada core, dan sisanya pada Uncore (perangkat keras ekstra-inti - Infinity Fabric, IO, IMC).

Sedangkan untuk hasil tes 2990WX, gambar yang dihasilkan terlihat sangat, sangat aneh.



Sebagian besar, data konsumsi daya hingga 15 core hampir sama dengan 2950X. Namun, dengan meningkatnya aliran, menjadi jelas bahwa lapisan matriks pertama jelas lebih disukai. Saat memuat stream tambahan dan menghubungkan matriks kedua, daya pada core-nya jauh lebih rendah - hingga 2,4 W per core. Lapisan zeppelin pertama pada beban penuh mengkonsumsi sekitar 6,6 watt per inti, tetapi sisa inti prosesor sekitar 2,4 watt. Sesuatu terjadi, akibatnya matriks pertama mendapat prioritas dalam nutrisi dibandingkan dengan yang lain. Perlu dicatat bahwa konsumsi daya chip adalah sekitar 180 watt, bukan 250 watt, seperti yang ditunjukkan TDP-nya.

Sekitar waktu ini, kami selesai menulis skrip uji kekuatan POV-Ray. Saya mengujinya pada 2990WX, saya menyajikan hasilnya. Dan sekarang mereka jauh lebih tinggi dari yang diharapkan:



Anehnya, ketika jumlah utas meningkat, beban menjadi sangat merata. Kami bahkan dapat sepenuhnya menggunakan semua TDP 250 W dengan pengaturan stok dan pendingin yang baik. Setelah memuat proses sepenuhnya, kami melihat konsumsi 193 watt oleh core, 55 watt oleh sisa komponen. Dalam keadaan apa pun kami tidak mengamati "kekenduran" dari nuklei aktif di bawah 3 watt. Ketika semua core dimuat, masing-masing inti mengkonsumsi "nyaman" 6 watt. Kami mencapai kekuatan prosesor 240 -250 W sambil memuat sekitar 40 utas. Dengan peningkatan lebih lanjut dalam aliran, inti yang ditambahkan menyebabkan redistribusi kekuasaan.

Dua ide muncul di benak saya. Yang pertama mudah diverifikasi: mungkin BIOS macet pada 180 W setelah menginstal 2950X? Saya memeriksa ulang, dan sebelum menjalankan tes dengan 2990WX, saya menguji 1920X yang sebelumnya diuji. Reset BIOS penuh tidak memengaruhi hasil. Saya dapat berpendapat bahwa ini bukan batasan daya BIOS. Gagasan kedua adalah memeriksa frekuensi. Setelah memeriksa hanya satu titik referensi (40 stream dimuat), kami menemukan sebaran kecil, tetapi hanya berkuasa.

Selama pengujian Prime95, matriks pertama berjalan pada 7 watt per inti dengan frekuensi 3.575 MHz. Kristal silikon kedua memberikan hasil 3 W per inti pada frekuensi 3.525 MHz. Core (idle) lainnya yang dioperasikan pada frekuensi 1775 MHz atau 2000 MHz, mengkonsumsi miliwatt.

Selama tes POV-Ray, setiap core aktif mengkonsumsi sekitar 9,1 watt per core dan memiliki frekuensi 3.575 MHz. Semua core idle berada pada frekuensi 2000 MHz (ada tiga lagi pada frekuensi 1775 MHz), mengkonsumsi miliwatt per core.

Selain data tentang konsumsi inti, chip umumnya terlihat dalam frekuensi yang sama. Hasil uji POV-Ray sedikit lebih tinggi, yang berarti konsumsi energi total lebih tinggi dengan POV-Ray.

Pada akhirnya, semuanya bermuara pada kenyataan bahwa uji daya Prime95 setelah melampaui ambang 20 core atau lebih, atau pada sirkuit mikro dengan beberapa kristal, tidak berfungsi seperti yang diharapkan. Di masa depan, kami akan menggunakan uji POV-Ray kami, yang mampu memeras lebih banyak prosesor multi-core modern.

Konsumsi Core vs Non-Core


Kembali ke saat di mana kita berbicara tentang frekuensi Infinity Fabric, kita dapat melihat rasio konsumsi daya sebagai bagian dari uji POV-Ray untuk 2990WX.



Meskipun kami mengamati beberapa penyimpangan dari hasil sebelumnya, data (selain konsumsi puncak) umumnya sesuai dengan uji daya Uncore kami dengan Prime95. Infinity Fabric masih menunjukkan daya 55-60 watt. Akibatnya, konsumsi non-nuklir sebagai persentase dari total kapasitas dimulai dari 75% dengan dua utas, mencapai 22% pada saat 40 utas diluncurkan.

Overclocking: 4.0 GHz untuk 500 W


Siapa bilang prosesor 250 W tidak boleh di-overclock? AMD dengan bangga memproduksi prosesor, yang masing-masing dijual dengan pengganda tidak terkunci, dan juga menggunakan bahan yang disolder sebagai antarmuka termal.

Sudah waktunya untuk bertobat. Kami tidak punya cukup waktu untuk overclocking. Prosesor ini memiliki frekuensi dasar 3,0 GHz, turbo 4,2 GHz. Di ruangan ber-AC menggunakan pendingin 500 W Enermax Liqtech, memuat semua inti di bawah POV-Ray, masing-masing inti bekerja pada frekuensi 3150 MHz, yang sangat jauh dari frekuensi turbo. Hal pertama yang saya lakukan adalah mengatur turbo full-core di 4,2 GHz, seperti halnya single-core. Ini memberi peningkatan yang baik.

Namun demikian, tahap berikutnya dari eksperimen overclocking saya mengejutkan saya. Saya mengatur pengali CPU ke 40-x di BIOS untuk 4,0 GHz pada semua core, setiap saat. Saya tidak mengatur voltase, meninggalkan mode otomatis, untuk melakukan ini, saya bahkan harus meninggalkan motherboard ASUS. Dengar, prosesor telah menyelesaikan test suite 4.0 GHz kami dengan sempurna. Saya terkejut.

Yang saya lakukan untuk overclock ini adalah beralih dari "otomatis" ke "40". Tes POV-Ray yang mengonsumsi lebih banyak daya telah berhasil. Setiap tes dari set berhasil. Meskipun kinerja termal tinggi (pada beban maksimum), pendingin lebih mudah diatasi dengan ini.



Pada beban penuh dalam uji POV-Ray, prosesor menunjukkan konsumsi 500 watt, pendingin dirancang untuk 500 watt. Pada titik tertentu, kami melihat lompatan ke 511 W, di mana 440 W dialokasikan untuk core (atau 13,8 W per core) dan 63 W untuk uncore (IF, IO, IMC), yang sesuai dengan 12,5% dari total konsumsi energi. Jika Anda ingin intercooler menghabiskan lebih sedikit daya, percepat persentasenya!

Mereka mengatur frekuensinya menjadi 4,1 GHz, dan sepertinya berfungsi juga, sampai kita memuat sistem sepenuhnya. Seperti disebutkan di atas, pada 4,2 GHz itu tidak mungkin untuk mendapatkan hasil kerja, bahkan dengan peningkatan voltase. Bagi mereka yang ingin mempelajari overclocking, pendinginan cairan bisa menjadi solusi.

Performa di 4,0 GHz


Jadi, jika frekuensi semua core adalah 3125 MHz, maka overclocking ke 4000 MHz harus memberikan peningkatan kinerja 28 persen, kan? Berikut adalah hasil dari beberapa tes kunci dari paket kami.













Akselerasi 2990WX memberi hasil beragam. Ini bekerja sangat baik dalam beberapa tes, masih tertinggal 2950X dalam yang lain karena arsitektur modul-ganda.

Overclocking memberikan hasil yang sangat baik dalam tes ini: Blender menunjukkan peningkatan throughput sebesar 19%, POV-Ray - sebesar 19%, 3DPM - sebesar 19%. Dalam tes lain, itu lebih rendah daripada 2950X (Photoscan), masih tertinggal (pemuatan aplikasi, WinRAR).

Overclocking tidak akan memperbaiki semua masalah kinerja pada 2990WX, tetapi tentu akan menguntungkan prosesor.

Terima kasih telah tinggal bersama kami. Apakah Anda suka artikel kami? Ingin melihat materi yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikannya kepada teman-teman Anda, diskon 30% untuk pengguna Habr pada analog unik dari server entry-level yang kami buat untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps dari $ 20 atau bagaimana membagi server? (opsi tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).

3 bulan gratis ketika membayar untuk Dell R630 baru untuk jangka waktu enam bulan - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD atau 2x240GB SSD / 1Gbps 10 TB - dari $ 99,33 sebulan , hanya sampai akhir Agustus, pesan bisa disini

Dell R730xd 2 kali lebih murah? Hanya kami yang memiliki 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV dari $ 249 di Belanda dan Amerika Serikat! Baca tentang Cara Membangun Infrastruktur Bldg. kelas menggunakan server Dell R730xd E5-2650 v4 seharga 9.000 euro untuk satu sen?

Source: https://habr.com/ru/post/id422207/


All Articles