Para peneliti dari Intel dan University of North Carolina mempercepat pertukaran data antara core CPU sebanyak 2-12 kali
Topologi prosesor Intel Core generasi ketujuh (sebelumnya bernama kode Kaby Lake), yang akan tersedia pada akhir 2016. Foto: IntelSekelompok peneliti dari University of North Carolina dan Intel telah mengembangkan teknologi CAF (Core to Core Communication Acceleration Framework) , yang secara signifikan dapat mempercepat pertukaran data antara inti prosesor. Dengan menghilangkan hambatan ini, produsen akhirnya akan dapat meningkatkan jumlah core dalam CPU tanpa peningkatan lalu lintas layanan yang eksponensial di antara mereka.Dalam implementasi program paralel, hal yang paling sulit adalah memastikan koordinasi sumber daya yang dibagi antar proses dengan benar. Pada prosesor modern, sinkronisasi interaksi paralel antara inti dilakukan dengan dua metode: menggunakan pengiriman pesan dan melalui memori bersama.Dalam kasus pertama, proses single-threaded diluncurkan pada setiap inti, yang bertukar data dengan proses lain yang berjalan pada kernel lain.Ketika berinteraksi melalui memori bersama pada setiap prosesor dari sistem multiprosesor, utas eksekusi yang dimiliki oleh satu proses diluncurkan. Streaming pertukaran data melalui sebagian memori yang umum untuk proses ini. Jumlah utas sesuai dengan jumlah prosesor.Para peneliti mengusulkan penerapan koordinasi sumber daya tersebutdi tingkat perangkat keras . Dalam abstrak dari karya ilmiah yang disiapkan, mereka mencatat bahwa "interaksi melalui memori bersama pada dasarnya termasuk cacat untuk mempertahankan koherensi dan kehilangan cache, yang sangat meningkatkan overhead dan menciptakan sejumlah besar lalu lintas jaringan [kelebihan]."Banyak tugas penting membutuhkan pertukaran lalu lintas yang besar di antara inti, sehingga peningkatan biaya overhead yang signifikan menjadi hit besar dalam kinerja. Ini juga berlaku untuk kinerja pipa komputasi, yang banyak digunakan dalam solusi perangkat lunak untuk pengoperasian paralelisme di tingkat perintah.Akselerasi perangkat keras mengoordinasikan kerja core dalam komputasi paralel. Koordinasi inti perangkat keras yang diusulkan jauh lebih efisien daripada metode sinkronisasi perangkat lunak apa pun yang saat ini digunakan."Pendekatan ini, yang kami sebut Kerangka CAF untuk Percepatan Komunikasi antar Cores , meningkatkan transfer data sebanyak 2-12 kali," kata Yan Solihin, profesor teknik elektro dan komputer di University of North Carolina dan rekan penulis penelitian. "Dengan kata lain, kecepatan eksekusi - dari awal hingga akhir - setidaknya dua kali lebih cepat."Dalam karya ilmiah yang disiapkan, penulis melakukan analisis overhead (lalu lintas jaringan yang berlebihan antara inti), yang terjadi ketika menyinkronkan perhitungan paralel dengan metode perangkat lunak yang ada. Dan mereka mengusulkan solusi alternatif.Elemen kunci dari kerangka kerja baru adalah modul perangkat keras manajemen antrian Perangkat Manajemen Antrian (QMD). Ia mampu melakukan fungsi komputasi sederhana dan terhubung dengan perangkat keras ke subsistem komunikasi, yaitu ke NoC (jaringan pada chip - internet mini di dalam prosesor ).
Ilustrasi dari artikel " Network on a chip - mini-Internet di dalam prosesor "Modul QMD mengambil tugas mengelola antrian dan menyinkronkan interaksi paralel dari inti, tanpa instruksi perangkat lunak tambahan pada inti CPU. Ini seperti router perangkat keras pada jaringan.Pengembangan di masa depan adalah penting mengingat peningkatan konstan pada prosesor modern. Ini adalah proses yang sepenuhnya alami, karena kecepatan jam hampir berhenti karena keterbatasan fisik alami. Pabrikan tidak punya pilihan selain untuk memparalelkan perhitungan.Dalam kondisi seperti itu, sinkronisasi interaksi paralel antara inti menjadi hambatan yang membatasi kinerja sistem. Dengan perutean lalu lintas yang efisien antar inti prosesor, Anda dapat terus meningkatkan skala arsitektur CPU dan membuat prosesor dengan puluhan atau ratusan inti dengan penskalaan kinerja yang hampir linier. Perutean lalu lintas yang efisien antar core adalah teknologi utama yang dibutuhkan untuk lebih lanjut skala arsitektur CPU multi-core.Selain berulang kali mempercepat pertukaran data antar core saat menyinkronkan komputasi paralel, modul QMD dapat berguna untuk menggabungkan data dari beberapa core. Para peneliti percaya bahwa itu akan mempercepat pemrosesan beberapa operasi komputasi dasar hingga 15%.Karya ilmiah " CAF: Core to Core Communication Acceleration Framework " akan dipresentasikan pada konferensi ke-25 tentang arsitektur paralel dan metode kompilasi PACT '16 , yang akan diselenggarakan 11-15 September 2016 di Haifa (Israel).Para penemu adalah Yipeng Wang (Universitas North Carolina), Ren Wang, Andrew Herdrich dan James Tsai (semuanya Intel Corp), dan penulis utama makalah ini adalah yang disebutkan di atas. Yan Solihin dari University of North Carolina dan US National Science Foundation.Artikel ini dimasukkan dalam Prosiding Konferensi Internasional 2016 tentang Arsitektur dan Kompilasi Paralel, hal. 351-362, doi: 10.1145 / 2967938.2967954. Pengumpulan laporan kemungkinan akan didistribusikan kepada peserta konferensi dan dipublikasikan di Internet.Source: https://habr.com/ru/post/id397275/
All Articles