Huawei Dorado V6: Panas Sichuan


Musim panas di Moskow tahun ini, jujur โ€‹โ€‹saja, tidak terlalu baik. Itu dimulai terlalu dini dan cepat, tidak semua orang berhasil bereaksi, dan itu sudah berakhir pada akhir Juni. Karena itu, ketika Huawei menyarankan agar saya pergi ke Cina, ke kota Chengdu, tempat pusat RnD mereka berada, sambil melihat ramalan cuaca di +34 derajat di bawah naungan, saya langsung setuju. Meski begitu, umur saya tidak sama dan tulang saya perlu sedikit dipanaskan. Tetapi saya ingin mencatat bahwa adalah mungkin untuk menghangatkan tidak hanya tulang, tetapi juga bagian dalam, karena provinsi Sichuan, di mana, pada kenyataannya, Chengdu terkenal dengan kecintaannya pada makanan pedas. Tapi tetap saja, blog ini bukan tentang perjalanan, jadi kembali ke tujuan utama perjalanan kami - jalur baru sistem penyimpanan - Huawei Dorado V6. Artikel ini akan sedikit memberi Anda gelombang dari masa lalu, seperti Itu ditulis sebelum pengumuman resmi, tetapi diterbitkan hanya setelah rilis. Jadi, hari ini kita melihat segala sesuatu yang menarik dan lezat yang telah disiapkan Huawei untuk kita.



Baris baru akan memiliki 5 model. Semua model kecuali 3000V6 dapat dalam dua versi - SAS dan NVMe. Antarmuka disk yang dapat Anda gunakan dalam sistem ini, port back-end dan jumlah disk drive yang dapat Anda instal dalam sistem tergantung pada pilihan. NVMe menggunakan SSD ukuran Palm, yang lebih tipis dari SSD SAS 2.5 "klasik dan dapat menampung hingga 36 unit. Baris baru adalah Semua Flash dan tidak ada konfigurasi disk.



Palm NVMe SSD


Menurut pendapat saya, Dorado 8000 dan 18000 tampaknya menjadi model yang paling menarik, Huawei memposisikan mereka sebagai sistem kelas atas, dan karena kebijakan penetapan harga Huawei, ia membedakan model-model Kelas Menengah ini dengan segmen pesaingnya. Pada model-model inilah saya akan berkonsentrasi hari ini dalam ulasan saya. Segera, saya perhatikan bahwa karena fitur desainnya, sistem dual-controller yang lebih muda memiliki arsitektur yang sedikit berbeda, berbeda dari Dorado 8000 dan 18000, jadi tidak semua yang akan saya bicarakan hari ini berlaku untuk model yang lebih muda.


Salah satu fitur utama dari sistem baru adalah penggunaan beberapa chip dari desain mereka sendiri, yang masing-masing memungkinkan untuk membawa beban logis dari prosesor pusat controller dan menambah fungsionalitas ke komponen yang berbeda.


Inti dari sistem baru ini adalah prosesor Kunpeng 920, yang dikembangkan dengan teknologi ARM dan diproduksi secara mandiri oleh Huawei. Bergantung pada model, jumlah inti bervariasi, frekuensinya dan jumlah prosesor yang dipasang di setiap pengontrol:
Huawei Dorado V6 8000 - 2CPU, 64 inti
Huawei Dorado V6 18000 - 4CPU, 48 inti


Huawei mengembangkan prosesor ini pada arsitektur ARM, dan sejauh yang saya tahu, awalnya direncanakan untuk menempatkannya hanya pada model Dorado 8000 dan 18000 yang lebih lama, seperti halnya dengan beberapa model V5, tetapi sanksi membuat penyesuaian untuk ide ini. Tentu saja, ARM juga berbicara tentang penolakan kerja sama dengan Huawei selama pengenaan sanksi, tetapi di sini situasinya berbeda dengan dengan Intel. Huawei memproduksi chip ini sendiri, dan tidak ada sanksi yang dapat menghentikan proses ini. Pemutusan hubungan dengan ARM hanya mengancam dengan hilangnya akses ke perkembangan baru. Adapun kinerja - di sini akan mungkin untuk menilai hanya setelah melakukan tes independen. Meskipun saya melihat bagaimana 1M IOPS dihapus dari sistem Dorado 18000 tanpa masalah, sampai saya melakukan ini dengan tangan saya sendiri di rak, saya tidak akan percaya. Tetapi kapasitas di controller benar-benar tidak cukup. Model lama dilengkapi dengan 4 pengontrol, masing-masing memiliki 4 prosesor yang diinstal, yang memberikan total 768 core.


Tapi saya akan memberi tahu Anda tentang kernel bahkan nanti, ketika kita melihat arsitektur sistem baru, tetapi untuk sekarang mari kita kembali ke chip lain yang terpasang dalam sistem. Chip Ascend 310 terlihat seperti solusi yang sangat menarik (seperti yang saya mengerti, adik lelaki Ascend 910, yang baru-baru ini diperkenalkan ke publik). Tugasnya adalah untuk menganalisis blok data yang tiba di sistem untuk meningkatkan rasio hit Baca. Masih sulit untuk mengatakan bagaimana ia akan menunjukkan dirinya dalam pekerjaan, karena Saat ini ia bekerja hanya sesuai dengan pola yang diberikan dan tidak memiliki kemampuan untuk belajar dalam mode intelektual. Tampilan mode cerdas dijanjikan dalam firmware di masa depan, kemungkinan besar pada awal tahun depan.


Mari beralih ke arsitektur. Huawei terus mengembangkan teknologi Smart Matrix-nya sendiri, yang menerapkan pendekatan jala penuh untuk menghubungkan komponen. Tetapi jika dalam V5 itu hanya untuk akses dari pengontrol ke disk, sekarang semua pengontrol memiliki akses ke semua port baik di Back-End dan Front-End.


Berkat arsitektur microservice baru, ini juga memungkinkan menyeimbangkan beban antara semua pengontrol, bahkan jika hanya ada satu lun. OS untuk jajaran array ini dikembangkan dari awal, dan tidak hanya dioptimalkan untuk penggunaan Flash-drive. Karena kenyataan bahwa semua pengontrol memiliki akses ke port yang sama, jika terjadi kegagalan atau reboot pengontrol, tuan rumah tidak kehilangan satu jalur tunggal ke sistem penyimpanan, dan pengalihan jalur dilakukan pada tingkat sistem penyimpanan data. Pada saat yang sama, penggunaan UltraPath pada host bukan kebutuhan yang ketat. "Penghematan" lain dalam instalasi sistem adalah sejumlah kecil tautan yang diperlukan. Dan jika dengan pendekatan "klasik" untuk 4 pengendali kita perlu 8 tautan dari 2 pabrik, maka dalam kasus Huawei genap 2 akan cukup (saya tidak berbicara tentang kecukupan bandwidth satu tautan).


Seperti pada versi sebelumnya, cache global dengan mirroring digunakan. Ini memungkinkan Anda kehilangan hingga dua kontroler secara bersamaan atau tiga kontroler secara seri tanpa memengaruhi ketersediaan. Tetapi perlu dicatat bahwa kami tidak melihat penyeimbangan muatan penuh antara 3 pengontrol yang tersisa jika terjadi kegagalan, pada demo stand. Beban pengontrol yang gagal sepenuhnya diambil alih oleh salah satu yang tersisa. Ada kemungkinan bahwa untuk ini perlu membiarkan sistem bekerja lebih lama dalam konfigurasi ini. Bagaimanapun, pada tes saya sendiri saya akan memeriksanya lebih terinci.
Huawei memposisikan sistem baru sebagai sistem NVMe End-to-End, tetapi saat ini frontend NVMeOF belum didukung, hanya FC, iSCSI atau NFS. Pada akhir ini atau awal berikutnya, seperti chip lainnya, kami dijanjikan dukungan RoCE.


Rak terhubung ke controller dengan cara yang sama menggunakan RoCE, dan ini memiliki satu kelemahan - kurangnya koneksi "loop" dari rak, seperti halnya dengan SAS. Menurut pendapat saya, sementara ini adalah kelemahan yang cukup besar, jika Anda telah merencanakan sistem yang cukup besar. Faktanya adalah bahwa semua rak terhubung secara seri, dan kegagalan salah satu rak memerlukan tidak dapat diaksesnya semua yang mengikutinya. Dalam hal ini, untuk memastikan toleransi kesalahan, kita harus menghubungkan semua rak ke controller, yang memerlukan peningkatan jumlah port backend yang diperlukan dalam sistem.


Dan satu hal lagi yang perlu disebutkan adalah pembaruan yang tidak mengganggu (NDU). Seperti yang saya katakan di atas, Huawei telah menerapkan pendekatan wadah dalam mengoperasikan OS untuk jalur Dorado baru, ini memungkinkan memperbarui dan memulai kembali layanan, tanpa perlu reboot penuh controller. Perlu disebutkan segera bahwa beberapa pembaruan akan berisi pembaruan kernel, dan dalam hal ini reboot klasik dari pengontrol terkadang masih diperlukan saat memperbarui, tetapi tidak selalu. Ini akan mengurangi tingkat pengaruh operasi ini pada sistem produktif.


Di gudang kami, sebagian besar array dari NetApp perusahaan. Oleh karena itu, saya pikir itu akan sangat logis jika saya membuat perbandingan kecil dengan sistem yang saya gunakan untuk bekerja cukup banyak. Ini bukan upaya untuk menentukan siapa yang lebih baik dan siapa yang lebih buruk atau yang arsitekturnya lebih menguntungkan. Saya akan mencoba dengan sungguh-sungguh dan tanpa fanatisme untuk membandingkan dua pendekatan berbeda untuk menyelesaikan masalah yang sama dari vendor yang berbeda. Ya, tentu saja, dalam hal ini, kami akan mempertimbangkan sistem Huawei dalam "teori" dan saya juga akan secara terpisah mencatat momen-momen yang hanya direncanakan untuk diimplementasikan dalam versi firmware mendatang. Apa plus yang saya lihat saat ini:


  1. Jumlah drive NVMe yang didukung. NetApp hari ini memiliki jumlah 288, Huawei tergantung pada model - 1600-6400. Pada saat yang sama, kapasitas maksimal Huawei yang dapat digunakan adalah 32PBe, seperti sistem NetApp (lebih tepatnya, mereka memiliki 31.64PBe). Dan ini terlepas dari kenyataan bahwa drive dengan volume yang sama didukung (hingga 15Tb). Huawei menjelaskan fakta ini sebagai berikut - mereka tidak memiliki kesempatan untuk membuat pendirian yang lebih besar. Secara teori, mereka tidak memiliki batas volume, tetapi mereka belum bisa menguji fakta ini. Tetapi perlu dicatat bahwa kemampuan flash drive sangat tinggi saat ini, dan dalam kasus sistem NVMe, kita dihadapkan dengan fakta bahwa 24 drive cukup untuk menggunakan sistem 2-controller top-end. Dengan demikian, peningkatan lebih lanjut dalam jumlah disk dalam sistem tidak hanya tidak akan memberikan peningkatan kinerja, tetapi juga akan mempengaruhi rasio IOPS / Tb. Tentu saja, ada baiknya melihat berapa banyak drive yang dapat ditarik oleh sistem 4-controller 8000 dan 16000, karena kemampuan dan potensi Kunpeng 920 masih belum sepenuhnya jelas.
  2. Lun memiliki pemilik di sistem NetApp. Yaitu hanya satu pengontrol yang dapat melakukan operasi dengan bulan, sedangkan yang kedua hanya melewati IO sendiri. Sistem Huawei, sebaliknya, tidak memiliki pemilik dan operasi dengan blok data (kompresi, deduplikasi) dapat dilakukan oleh salah satu pengendali, serta ditulis ke disk.
  3. Tidak ada port drop jika terjadi kegagalan salah satu pengendali. Bagi sebagian orang, momen ini terlihat sangat kritis. Intinya adalah bahwa beralih di dalam sistem penyimpanan harus lebih cepat daripada di sisi host. Dan jika dalam kasus NetApp yang sama, dalam praktiknya kami mengungkapkan dekorasi 5 detik ketika menarik keluar controller dan berpindah jalur, maka beralih ke Huawei masih harus berlatih.
  4. Tidak perlu me-restart controller selama upgrade. Saya sangat khawatir tentang hal ini dengan rilis yang lebih sering dari versi baru dan cabang firmware untuk NetApps. Ya, beberapa pembaruan untuk Huawei masih akan membutuhkan restart, tetapi tidak semua.
  5. 4 pengendali Huawei untuk harga dua pengendali NetApp. Seperti yang saya katakan di atas, berkat kebijakan penetapan harga Huawei, Huawei dapat bersaing dengan Mid-range dengan model Hight-end-nya.
  6. Kehadiran chip tambahan di pengendali rak dan kartu port, yang berpotensi dimaksudkan untuk meningkatkan efisiensi sistem.

Kontra dan ketakutan secara umum:


  1. Koneksi langsung rak ke pengontrol atau kebutuhan untuk sejumlah besar port back-end untuk menghubungkan semua rak ke pengontrol.
  2. Arsitektur ARM dan keberadaan sejumlah besar chip - seberapa efisien kerjanya, dan apakah akan ada kinerja yang cukup.

Sebagian besar ketakutan dan ketakutan akan mampu menghilangkan pengujian sendiri dari baris baru. Saya berharap bahwa segera setelah rilis mereka akan muncul di Moskow dan akan ada cukup banyak dari mereka untuk dengan cepat mendapatkan satu untuk tes mereka sendiri. Sejauh ini, kita dapat mengatakan bahwa pendekatan perusahaan secara keseluruhan terlihat menarik, dan lini baru terlihat sangat baik terhadap pesaing. implementasi akhir menimbulkan banyak pertanyaan, karena kita akan melihat banyak hal hanya pada akhir tahun, dan mungkin hanya pada tahun 2020.

Source: https://habr.com/ru/post/id467975/


All Articles