Rupanya, era komputasi GPU telah tiba! Intel berkinerja buruk. Jika Anda belum membaca blog saya secara teratur beberapa tahun terakhir, saya akan menjelaskan bahwa saya [
Alex St. John ]
berdiri pada asal-usul tim DirectX asli di Microsoft pada tahun 1994, dan menciptakan API Direct3D bersama dengan pencipta directX pertama lainnya (Craig Eisler dan Eric Engstrom) dan berkontribusi pada distribusinya di industri video game dan di antara produsen chip grafis. Pada topik ini di
blog saya, Anda dapat menemukan banyak cerita, tetapi yang terkait langsung dengan posting ini, saya tulis pada tahun 2013.
Sejarah Nvidia
Saya pikir versi game Nvidia di masa depan adalah benar, dan saya benar-benar menikmati hidup di era ketika saya dapat bekerja dengan kemampuan komputer yang luar biasa. Tampaknya bagi saya bahwa saya telah hidup di era di mana saya bisa berjalan di sepanjang jembatan Enterprise dan bermain dengan drive warp. Dan secara harfiah - Nvidia menyebut warp unit minimum dari proses paralel yang dapat dijalankan pada GPU.
Mereka yang mengikuti harga saham mungkin memperhatikan bahwa saham Nvidia baru-baru ini naik tajam setelah bertahun-tahun naik lambat. Tampak bagi saya bahwa terobosan yang tiba-tiba ini mengumumkan perubahan revolusioner dalam komputasi komputer, yang merupakan puncak dari kemajuan bertahun-tahun dalam pengembangan
GPGPU . Hingga hari ini, Intel telah mempertahankan monopoli atas komputasi di pasar industri, berhasil memukul mundur serangan pesaing pada keunggulan mereka dalam komputasi industri. Dominasi ini telah berakhir tahun ini, dan pasar melihatnya semakin dekat. Untuk memahami apa yang terjadi dan mengapa ini terjadi, saya akan kembali ke tahun-tahun awal saya di Microsoft.
Pada tahun 90-an, Bill Gates menciptakan istilah "Kerjasama" [Kerjasama = kompetisi + kerja sama] untuk menggambarkan kemitraan kompetitif yang disiksa dengan para pemimpin industri teknologi lainnya saat itu. Ketika berbicara tentang Intel, istilah ini sering muncul. Dan sementara nasib dan kesuksesan Microsoft dan Intel terjalin semakin erat, kedua perusahaan terus-menerus saling bertarung untuk mendapatkan dominasi. Kedua perusahaan memiliki tim orang-orang yang "berspesialisasi" dalam mencoba untuk mendapatkan keuntungan di atas saingan mereka. Paul Maritz, yang merupakan kepala eksekutif Microsoft saat itu, sangat khawatir bahwa Intel mungkin akan mencoba untuk virtualisasi Windows, memungkinkan banyak OS lain yang bersaing untuk memasuki pasar dan ada di PC desktop secara paralel dengan Windows. Menariknya, Paul Maritz kemudian menjadi CEO VMWARE. Memang, Intel secara aktif berinvestasi dalam upaya semacam itu. Salah satu strategi mereka adalah upaya untuk meniru pada tingkat perangkat lunak semua fungsi besi yang diterima secara umum, dengan mana OEM biasanya memasok PC - kartu video, modem, kartu suara, peralatan jaringan, dll. Dengan mentransfer semua komputasi eksternal ke prosesor Intel, perusahaan dapat menghancurkan penjualan dan pertumbuhan semua platform komputasi alternatif yang mungkin bisa tumbuh, mengancam CPU Intel. Secara khusus, pengumuman Intel tentang teknologi 3DR pada tahun 1994 mendorong Microsoft untuk membuat DirectX.
Saya bekerja untuk tim di Microsoft, yang bertanggung jawab atas posisi strategis perusahaan dalam terang ancaman persaingan di pasar, "Grup Hubungan Pengembang [DRG]." Intel meminta Microsoft mengirim perwakilan untuk berbicara di presentasi 3DR. Sebagai seorang ahli di bidang grafis dan 3D di Microsoft, saya dikirim dengan misi khusus untuk menilai ancaman yang berpotensi ditimbulkan oleh inisiatif baru Intel dan untuk merumuskan strategi yang efektif untuk menghadapinya. Saya memutuskan bahwa Intel benar-benar mencoba untuk virtualisasi Windows, meniru pada tingkat perangkat lunak semua perangkat pemrosesan data yang mungkin. Saya menulis proposal yang disebut "menganggap serius hiburan," di mana saya mengusulkan untuk memblokir upaya Intel untuk menjadikan Windows kecil untuk menciptakan pasar konsumen yang kompetitif untuk fitur perangkat keras baru. Saya ingin membuat satu set driver Windows baru yang memungkinkan untuk kompetisi besar di pasar perangkat keras, sehingga pekerjaan media baru, termasuk audio, input data, video, teknologi jaringan, dll. di pasar gim PC yang kami buat, tergantung pada driver Windows kami sendiri. Intel tidak dapat mengatasi persaingan di pasar bebas yang kami ciptakan untuk perusahaan yang memproduksi zat besi konsumen, dan oleh karena itu tidak dapat membuat CPU yang dapat secara efektif memvirtualisasikan semua fungsi yang diperlukan pengguna. Maka DirectX lahir.
Di blog ini Anda dapat menemukan banyak cerita tentang peristiwa seputar penciptaan DirectX, tetapi singkatnya, "strategi jahat" kami telah berhasil. Microsoft menyadari bahwa untuk mendominasi pasar konsumen dan mengandung Intel, perlu untuk fokus pada video game, setelah itu puluhan produsen chip 3D muncul. Dua puluh tahun kemudian, di antara sejumlah kecil yang selamat, Nvidia, bersama dengan ATI, sejak saat itu diakuisisi oleh AMD, mendominasi pasar grafis konsumen dan, baru-baru ini, pasar komputasi industri.
Ini membawa kita kembali ke tahun 2017 saat ini, ketika GPU akhirnya mulai sepenuhnya menggantikan prosesor x86, yang digunakan semua orang untuk memperlakukan dengan kagum. Kenapa sekarang dan mengapa GPU? Rahasia hegemoni x86 adalah keberhasilan Windows dan kompatibilitas dengan instruksi x86 hingga tahun 1970-an. Intel dapat mempertahankan dan meningkatkan monopoli di pasar industri karena fakta bahwa biaya porting aplikasi ke CPU dengan set instruksi lain, yang tidak menempati ceruk pasar, terlalu tinggi. Rangkaian fitur fenomenal dari OS Windows yang dikaitkan dengan platform x86 telah memperkuat posisi pasar Intel. Awal dari akhir datang ketika Microsoft dan Intel bersama-sama tidak dapat membuat lompatan ke dominasi di pasar komputasi mobile yang sedang berkembang. Untuk pertama kalinya dalam beberapa dekade, celah muncul di pasar CPU x86, yang diisi oleh prosesor ARM, setelah itu OS Windows alternatif baru dari Apple dan Google mampu menangkap pasar baru. Mengapa Microsoft dan Intel gagal melakukan lompatan ini? Anda dapat menemukan mobil dengan alasan yang menarik, tetapi dalam kerangka artikel ini saya ingin menekankan satu hal - x86 bagasi kompatibilitas mundur. Untuk pertama kalinya, efisiensi energi menjadi lebih penting bagi keberhasilan CPU daripada kecepatan. Semua transistor dan jutaan baris kode untuk x86 yang tertanam oleh Intel dan Microsoft di PC telah menjadi hambatan bagi efisiensi energi. Aspek terpenting dari hegemoni pasar Intel dan Microsoft pada satu titik menjadi penghalang.

Kebutuhan Intel akan peningkatan kecepatan yang konstan dan dukungan untuk kompatibilitas mundur memaksa perusahaan untuk menghabiskan lebih banyak transistor yang haus energi untuk mendapatkan peningkatan kecepatan yang semakin menurun di setiap generasi prosesor x86 yang baru. Kompatibilitas mundur juga secara serius menghambat kemampuan Intel untuk memparalelkan chip-nya. GPU paralel pertama muncul di tahun 90-an, dan CPU dual-core Intel pertama dirilis hanya pada tahun 2005. Bahkan hari ini, CPU Intel yang paling kuat hanya dapat menangani 24 core, meskipun sebagian besar kartu grafis modern memiliki prosesor dengan ribuan core. GPU yang semula paralel tidak membawa bagasi kompatibilitas ke belakang, dan berkat teknologi independen arsitektur, API seperti Direct3D dan OpenGL bebas untuk berinovasi dan meningkatkan paralelisme tanpa harus berkompromi pada kompatibilitas atau efisiensi transistor. Pada 2005, GPU bahkan telah menjadi platform komputasi tujuan umum yang mendukung komputasi paralel tujuan umum heterogen. Dengan heterogenitas, maksud saya chip dari AMD dan NVIDIA dapat menjalankan program yang dikompilasi yang sama, meskipun arsitektur tingkat rendah yang sama sekali berbeda dan serangkaian instruksi. Dan pada saat chip dari Intel mencapai penurunan lonjakan kinerja, GPU menggandakan kecepatannya setiap 12 bulan, sekaligus mengurangi konsumsi daya hingga setengahnya! Paralelisasi ekstrim memungkinkan untuk menggunakan transistor dengan sangat efisien, memberikan setiap transistor berturut-turut ditambahkan ke GPU dengan kemampuan untuk secara efektif mempengaruhi kecepatan operasi, sementara peningkatan jumlah transistor x86 yang bertambah jumlahnya tidak sibuk.
Meskipun GPU semakin menginvasi superkomputer industri, media, dan VDI, perubahan utama di pasar terjadi ketika Google mulai menggunakan GPU secara efektif untuk melatih jaringan saraf yang mampu melakukan hal-hal yang sangat berguna. Pasar menyadari bahwa AI akan menjadi masa depan pemrosesan data besar dan membuka pasar otomatisasi baru yang besar. GPU ideal untuk pengoperasian jaringan saraf. Hingga saat ini, Intel telah berhasil mengandalkan dua pendekatan yang telah menekan pertumbuhan pengaruh GPU pada komputasi industri.
1. Intel menjaga kecepatan bus PCI tetap rendah dan membatasi jumlah jalur I / O yang didukung oleh prosesor mereka, sehingga memastikan bahwa GPU akan selalu bergantung pada prosesor Intel untuk memproses beban mereka dan akan tetap terpisah dari berbagai aplikasi komputasi kecepatan tinggi real-time yang berharga dari Karena keterlambatan dan keterbatasan bandwidth PCI. Sementara CPU mereka mampu membatasi akses aplikasi ke kecepatan GPU, Nvidia mendekam di ujung PCI bus tanpa akses ke banyak beban industri yang praktis berguna.
2. Menyediakan GPU murah dengan fungsi minimal pada prosesor konsumen untuk mengisolasi Nvidia dan AMD dari pasar gaming premium dan dari penerimaan umum oleh pasar.
Ancaman yang meningkat dari upaya Nvidia dan Intel yang gagal untuk menciptakan akselerator komputer super kompatibel x86 memaksa Intel untuk memilih taktik yang berbeda. Mereka telah mengakuisisi Altera dan ingin memasukkan FPGA yang dapat diprogram dalam prosesor generasi mendatang Intel. Ini adalah cara yang rumit untuk memastikan bahwa prosesor Intel mendukung kemampuan I / O yang lebih besar dibandingkan dengan perangkat keras PCI bus pesaing yang terbatas, dan bahwa GPU tidak mendapatkan keuntungan apa pun. Dukungan FPGA memungkinkan Intel untuk mendukung komputasi paralel pada chip mereka, tanpa bermain di gerbang pasar yang berkembang untuk aplikasi yang menggunakan GPU. Ini juga memungkinkan produsen komputer industri untuk membuat perangkat keras yang sangat khusus, masih bergantung pada x86. Ini adalah langkah brilian dari Intel, karena mengecualikan kemungkinan GPU memasuki pasar industri di beberapa arah sekaligus. Cemerlang, tetapi kemungkinan besar akan menemui kegagalan.
Lima berita berurutan menjelaskan alasan saya yakin pesta x86 akan berakhir pada 2017.
1.
Dana VisionFund SoftBank Mendapat $ 93 Miliar dalam Investasi dari Perusahaan yang Ingin Mengganti Intel2.
SoftBank membeli ARM Holdings seharga $ 32 miliar3.
SoftBank membeli saham Nvidia sebesar $ 4 miliar4. Nvidia meluncurkan
Project Denver [nama kode untuk mikroarsitektur Nvidia yang mengimplementasikan set instruksi ARMv8-A 64/32-bit menggunakan kombinasi decoder perangkat keras sederhana dan penerjemah biner perangkat lunak dengan rekompilasi dinamis / kira-kira. perev.]
5.
NVIDIA mengumumkan Xavier
Tegra SOC dengan GPU Volta dengan 7 miliar transistor, 512 CUDA Cores dan 8 ARM64 Custom Cores - chip ARM / Hybrid mobile dengan core ARM yang dipercepat GPU.
Mengapa urutan peristiwa ini penting? Itu tahun ini bahwa generasi pertama GPU independen memasuki pasar dalam akses luas, dan mampu meluncurkan OS sendiri tanpa hambatan dalam bentuk PCI. Nvidia tidak lagi membutuhkan prosesor x86. ARM memiliki sejumlah besar sistem operasi dan aplikasi konsumen dan industri yang diangkut ke sana. Semua pasar industri dan cloud beralih ke chip dari ARM sebagai pengontrol untuk berbagai solusi pasar mereka. FPGA sudah terintegrasi ke dalam chip ARM. Chip ARM mengkonsumsi sedikit daya, lebih rendah kinerjanya, tetapi GPU sangat cepat dan efisien, sehingga GPU dapat memberikan daya prosesor, dan core ARM dapat menangani operasi IO dan UI yang membosankan yang tidak memerlukan daya pemrosesan. Semakin banyak aplikasi yang bekerja dengan data besar, komputasi kinerja tinggi, pembelajaran mesin tidak lagi membutuhkan Windows, dan mereka tidak bekerja di x86. 2017 adalah tahun di mana Nvidia memutuskan dan menjadi alternatif kompetitif yang benar-benar layak untuk komputasi industri berbasis x86 di pasar baru yang berharga yang tidak cocok untuk solusi berbasis x86.
Jika prosesor ARM tidak cukup kuat untuk kebutuhan Anda, maka
IBM, bekerja sama dengan Nvidia, akan menghasilkan generasi baru Power9 CPU untuk memproses data besar yang bekerja dengan 160 jalur PCIe.
AMD juga meluncurkan CPU Ryzen baru , dan tidak seperti Intel, AMD tidak memiliki kepentingan strategis dalam menghambat kinerja PCI. Chip konsumen mereka mendukung 64 PCIe 3.0 lane, dan yang profesional mendukung 128. AMD juga meluncurkan cross-compiler HIP baru yang membuat aplikasi CUDA kompatibel dengan GPU AMD. Terlepas dari kenyataan bahwa kedua perusahaan ini bersaing satu sama lain, keduanya akan mendapat manfaat dari perpindahan Intel di pasar industri dengan pendekatan alternatif untuk komputasi GPU.
Semua ini berarti bahwa di tahun-tahun mendatang, solusi berbasis GPU akan menangkap komputasi industri dengan kecepatan yang meningkat, dan dunia antarmuka desktop akan semakin bergantung pada visualisasi cloud atau bekerja pada prosesor ARM seluler, karena bahkan
Microsoft telah mengumumkan dukungan untuk ARM .

Menyatukan semuanya, saya memperkirakan bahwa dalam beberapa tahun kita hanya akan mendengar tentang pertempuran antara GPU dan FPGA untuk keuntungan dalam komputasi industri, sementara era CPU secara bertahap akan berakhir.