Kami berbagi pengalaman kami tentang bagaimana SSD muncul di bawah RAID dan level array mana yang lebih menguntungkan

Pada artikel sebelumnya, kami sudah membahas pertanyaan "Apakah RAID akan berlaku untuk SSD" menggunakan drive Kingston sebagai contoh, tetapi kami melakukan ini hanya dalam kerangka level nol. Pada artikel ini, kami akan menganalisis opsi untuk menggunakan solusi NVMe profesional dan rumahan di jenis RAID array yang paling populer dan berbicara tentang kompatibilitas pengontrol Broadcom dengan drive Kingston.



Mengapa saya perlu RAID pada SSD?


Keuntungan dari array penyimpanan berbasis SSD dibandingkan array penyimpanan hard disk termasuk berkurangnya waktu akses ke drive dan kinerja baca / tulis yang unggul. Namun, untuk kinerja RAID berbasis SSD yang ideal, diperlukan kombinasi prosesor, cache, perangkat lunak, dan perangkat keras yang optimal. Ketika semua faktor ini bekerja bersama-sama dengan sempurna, array RAID dari SSD dapat secara signifikan mengungguli konfigurasi yang sebanding menggunakan HDD tradisional.

SSD tipikal mengkonsumsi daya lebih sedikit daripada hard drive, jadi ketika menggabungkan sejumlah besar solid-state drive ke dalam array RAID, menghemat energi dibandingkan dengan array RAID dari HDD juga dapat menyebabkan biaya yang lebih rendah ketika membayar tagihan listrik perusahaan.

Namun, SSD RAID memiliki batasan dan kekurangan: khususnya, harga yang lebih tinggi per gigabyte ruang dibandingkan dengan hard drive dengan kapasitas yang sebanding. Dan flash MTBF dibatasi oleh sejumlah siklus penulisan ulang. Artinya, drive SSD memiliki masa pakai tertentu, yang tergantung pada operasinya: semakin aktif informasi yang ditulis ulang, semakin cepat drive akan gagal. SSD perusahaan, di sisi lain, memiliki umur yang layak dibandingkan dengan hard drive mekanis.

Bagaimana Kingston SSDs Hidup dalam Mode RAID dengan Pengendali Broadcom


Pada awal munculnya SSD, desain RAID penuh dengan banyak nuansa. Termasuk karena penggunaan HDD-drive yang kurang toleran. Solid state drive jauh lebih dapat diandalkan daripada rekan-rekan mereka berdasarkan pada disk magnetik. Seperti yang kita ketahui, tidak ada elemen bergerak dalam solusi SSD, sehingga kerusakan mekanis dikurangi menjadi nol. Kegagalan SSD karena lonjakan daya juga tidak mungkin, mengingat pada tingkat PC rumah Anda dan server apa pun Anda dilindungi oleh UPS, soket ekstensi, dan bahkan catu daya.

Pada saat yang sama, solid-state drive memiliki nilai tambah yang signifikan: bahkan jika sel-sel memori usang untuk menulis, data masih dapat dibaca dari mereka, tetapi jika disk magnetik rusak, sayangnya.



Saat ini, menggunakan solusi SSD dalam susunan RAID dari berbagai tingkat adalah praktik yang cukup normal. Hal utama adalah memilih solid state drive yang tepat, latensi yang minimal. Ini juga ideal untuk menggunakan SSD dari pabrikan yang sama dan model yang sama sehingga tidak ada kecacatan drive yang mendukung berbagai jenis beban dan dibangun berdasarkan berbagai jenis memori, pengontrol, dan teknologi lainnya. Artinya, jika kami memutuskan untuk membeli empat atau 16 Kingston NVMe SSDs untuk membuat array RAID, maka akan lebih baik jika mereka semua berasal dari seri dan kisaran model yang sama.

Ngomong-ngomong, di artikel terakhir, kami mengutip pengontrol Broadcom sebagai contoh ketika kami berbicara tentang Kingston NVMe SSD. Faktanya adalah bahwa dalam manual untuk drive yang kompatibel dengan perangkat ini (termasuk solusi dari SSD pabrikan Amerika tersebut) segera terdaftar, dengan mana pengontrol akan bekerja dengan sempurna. Penting untuk mengandalkan informasi ini ketika memilih bundel "controller-SSD" untuk RAID.

Kami menganalisis karya Kingston SSDs dalam jenis RAID paling populer - "1", "5", "10", "50"


Jadi, level "nol" RAID tidak memberikan redundansi data, tetapi hanya meningkatkan produktivitas. RAID 0 tidak memberikan perlindungan data sama sekali, oleh karena itu, kami tidak akan mempertimbangkannya dalam segmen korporat. RAID 1, di sisi lain, menyediakan redundansi total, tetapi hanya peningkatan kinerja yang sederhana, dan karenanya harus dipertimbangkan jika peningkatan kinerja bukan merupakan faktor mendasar ketika membuat array RAID dari SSD.

RAID 1 berbasis pada Kingston SSD dan pengontrol Broadcom


Jadi, susunan RAID tingkat pertama berdasarkan pengontrol Broadcom MegaRAID 9460-16i menggabungkan dua hingga 32 drive Kingston, yang merupakan salinan satu sama lain, dan memberikan redundansi lengkap. Jika menggunakan HDD tradisional, kecepatan menulis dan membaca data tetap pada tingkat HDD ini sendiri, kemudian menggunakan solusi NVMe SSD kami mendapatkan peningkatan kinerja sepuluh kali lipat. Terutama dalam hal waktu akses data. Misalnya, dengan dua Kingston DC1000M U.2 NVMe SSD di server RAID 1, kami mendapatkan 350.000 IOPS saat membaca data acak dan 75.000 IOPS saat menulis.



Dalam hal kecepatan baca berurutan, hasilnya akan sesuai dengan karakteristik drive - 3200 MB / s. Tetapi, karena kedua NVMe SSD operasional, data dapat dibaca dari mereka pada saat yang sama, yang membuat operasi membaca cukup cepat. Tetapi kecepatan tulis (diklaim 2000 MB / dtk) akan lebih lambat, karena setiap operasi penulisan dilakukan dua kali.



Larik RAID 1 sangat ideal untuk basis data kecil atau lingkungan lain yang membutuhkan toleransi kesalahan tetapi kapasitas kecil. Drive mirroring terutama membantu dalam skenario pemulihan bencana (kinerja sedikit memburuk) karena memberikan "reanimation" instan dari data penting jika salah satu drive dalam array gagal. Tetapi, karena tingkat perlindungan ini membutuhkan dua kali lipat kapasitas untuk menyimpan salinan data yang sudah dipantulkan (100 TB akan membutuhkan 200 TB ruang penyimpanan), banyak sistem perusahaan menggunakan opsi penyimpanan yang lebih ekonomis: RAID 5 dan RAID 6.

RAID 5 berbasis pada Kingston SSD dan pengontrol Broadcom


Untuk mengatur array RAID tingkat kelima, kita memerlukan setidaknya tiga drive, data yang digarisbawahi (ditulis secara siklis ke semua drive dalam array), tetapi tidak digandakan. Ketika mengorganisir mereka, seseorang harus memperhitungkan struktur mereka yang lebih kompleks, karena konsep seperti "checksum" (atau "paritas") muncul di sini. Konsep ini mengacu pada fungsi aljabar logis XOR (ini juga merupakan "OR" eksklusif), yang menentukan penggunaan setidaknya tiga drive dalam array (maksimum - 32). Dalam hal ini, informasi paritas direkam pada semua "disk" dalam array.



Untuk rangkaian empat SSD SATA500 DC500R Kingston dengan kapasitas masing-masing 3,84 TB, kami mendapatkan ruang 11,52 TB dan 3,84 untuk checksum. Dan jika Anda menggabungkan 16 Kingston DC1000M U.2 NVMe drive dalam RAID tingkat kelima dengan kapasitas 7,68 TB, kami akan mengajarkan 115,2 TB dengan kehilangan 7,68 TB. Seperti yang Anda lihat, semakin banyak drive, semakin baik. Ini juga lebih baik karena semakin banyak drive di RAID 5, semakin tinggi total kinerja penulisan. Dan pembacaan linear akan mencapai RAID 0.



Grup drive RAID 5 menyediakan throughput tinggi (terutama untuk file besar) dan redundansi dengan kehilangan daya minimal. Jenis organisasi susunan ini paling cocok untuk jaringan yang melakukan banyak operasi I / O kecil secara bersamaan. Tetapi tidak layak menggunakannya untuk tugas-tugas yang membutuhkan sejumlah besar operasi tulis blok kecil atau kecil.
Ada satu lagi nuansa: jika setidaknya salah satu drive NVMe gagal, RAID 5 masuk ke mode degradasi dan kegagalan perangkat penyimpanan lain dapat menjadi penting untuk semua data. Jika terjadi kegagalan drive tunggal dalam array, pengontrol RAID menggunakan informasi paritas untuk membuat kembali semua data yang hilang.

RAID 10 berbasis pada Kingston SSD dan pengontrol Broadcom


Jadi, RAID 0 memberi kita peningkatan dua kali lipat dalam kecepatan dan waktu akses, dan RAID 1 memberikan keandalan. Akan ideal untuk menggabungkan mereka, dan di sini RAID 10 (atau 1 + 0) datang untuk menyelamatkan. "Sepuluh" dirakit dari empat SATA SSD- atau NVMe-drive (maksimum - 32) dan menyiratkan array "mirror", jumlah drive yang harus selalu kelipatan empat. Data dalam array ini ditulis dengan mempartisi ke dalam blok-blok tetap (seperti dalam kasus RAID 0) dan interleaving antar drive, mendistribusikan salinan antara "disk" di RAID 1. Dan karena kemungkinan akses simultan ke beberapa grup disk, RAID 10 menunjukkan kinerja tinggi.



Karena RAID 10 dapat mendistribusikan data melalui beberapa pasangan cermin, ini berarti RAID 10 dapat menyebabkan kegagalan satu drive secara berpasangan. Namun, jika terjadi kegagalan kedua pasangan cermin (mis., Keempat drive), kehilangan data yang tidak terhindarkan akan terjadi. Sebagai hasilnya, kami juga mendapatkan toleransi kesalahan dan keandalan yang baik. Tetapi perlu diingat bahwa, seperti RAID 1, array level kesepuluh hanya menggunakan setengah dari total kapasitas, dan karenanya merupakan solusi yang mahal. Ya, dan sulit dikonfigurasi.

RAID 10 cocok untuk digunakan dengan gudang data yang membutuhkan redundansi 100% dari grup disk cermin, serta peningkatan kinerja RAID 0 I / O. Ini adalah solusi terbaik untuk database berukuran sedang atau lingkungan apa pun yang membutuhkan toleransi kesalahan lebih tinggi daripada RAID 5.

RAID 50 berbasis pada Kingston SSD dan pengontrol Broadcom


Array gabungan, mirip dengan RAID dari level kesepuluh, yang merupakan array level-nol yang dibuat dari array level kelima. Seperti pada kasus sebelumnya, tujuan utama dari array ini adalah untuk menggandakan kinerja sambil mempertahankan keandalan data dalam array RAID 5. Pada saat yang sama, RAID 50 memberikan peningkatan kinerja penulisan dan perlindungan data yang lebih baik daripada standar RAID 5 jika terjadi kegagalan disk, dan juga mampu pemulihan lebih cepat jika terjadi kegagalan salah satu drive.



Grup disk RAID 50 membagi data menjadi blok yang lebih kecil, dan kemudian mendistribusikannya ke setiap RAID 5. Grup disk RAID 5, pada gilirannya, juga membagi data menjadi blok yang lebih kecil, menghitung paritas, melakukan operasi OR logis pada blok, dan kemudian melakukan operasi tulis ke blok data dan paritas untuk setiap disk dalam grup disk.

Dan meskipun kinerja pasti menurun jika terjadi kegagalan salah satu drive, itu tidak sepenting dalam RAID 5 array, karena satu kegagalan hanya mempengaruhi satu array, meninggalkan yang lain sepenuhnya operasional. Bahkan, RAID 50 dapat menahan hingga delapan kegagalan drive HDD / SSD / NVMe jika masing-masing drive gagal dalam array RAID 5 yang terpisah.



RAID 50 paling baik digunakan untuk aplikasi yang membutuhkan keandalan tinggi dan harus menangani sejumlah besar permintaan dengan tetap mempertahankan kecepatan transfer data yang tinggi dan drive berbiaya lebih rendah dari RAID 10. Namun, karena setidaknya enam drive diperlukan untuk mengkonfigurasi RAID 50, biaya tidak sepenuhnya dikecualikan sebagai faktor. Salah satu kelemahan dari RAID 50 adalah bahwa, seperti RAID 5, ia membutuhkan pengontrol yang canggih: seperti Broadcom MegaRAID 9460-16i yang kami sebutkan di artikel sebelumnya.

Perlu dicatat juga bahwa RAID 50 memiliki ruang disk lebih sedikit daripada RAID 5, karena alokasi kapasitas untuk konten catatan paritas. Namun, masih memiliki lebih banyak ruang yang dapat digunakan daripada level RAID lainnya, terutama yang menggunakan mirroring. Dengan persyaratan minimum enam drive, RAID 50 bisa menjadi pilihan yang mahal, tetapi ruang disk tambahan membenarkan biaya dengan melindungi data perusahaan. Jenis array ini direkomendasikan untuk bekerja dengan data yang membutuhkan keandalan tinggi penyimpanan, permintaan frekuensi tinggi, kecepatan transmisi tinggi dan kapasitas tinggi untuk hosting.

RAID 6 dan RAID 60: Kami Belum Lupa Tentang Mereka


Karena kita telah berbicara tentang susunan level kelima dan kelima, merupakan dosa jika tidak menyebutkan jenis susunan array seperti RAID 6 dan RAID 60.



Kinerja RAID 6 mirip dengan RAID 5, tetapi di sini setidaknya dua drive diberikan di bawah paritas, yang memungkinkan array untuk bertahan dari kegagalan dua drive tanpa kehilangan data (di RAID 5, situasi ini sangat tidak diinginkan). Ini memastikan keandalan yang lebih tinggi. Jika tidak, semuanya sama seperti pada array tingkat kelima: jika terjadi kegagalan satu atau dua disk, pengontrol RAID menggunakan blok paritas untuk menciptakan kembali semua informasi yang hilang. Jika dua drive gagal, pemulihan tidak terjadi secara bersamaan: pertama, drive pertama dihidupkan kembali, lalu yang kedua. Dengan demikian, dua operasi pemulihan data dilakukan.



Sangat mudah untuk menebak bahwa jika RAID 50 adalah array tingkat-nol dari array tingkat kelima, maka RAID 60 adalah array tingkat-nol dari array tingkat keenam, yang baru saja kita bicarakan. Yaitu, organisasi penyimpanan RAID ini memungkinkan Anda selamat dari kehilangan dua SSD di setiap kelompok drive RAID 6. Prinsip operasi ini mirip dengan yang kami jelaskan di bagian RAID 50, tetapi jumlah kegagalan yang dapat ditahan oleh array dari level keenam puluh meningkat dari 8 hingga 16 drive. Biasanya, array ini digunakan untuk layanan pelanggan online, yang membutuhkan toleransi kesalahan yang tinggi.

Untuk meringkas:


Meskipun mirroring memberikan toleransi kesalahan lebih dari RAID 50/60, itu juga membutuhkan lebih banyak ruang. Karena jumlah data berlipat ganda, Anda sebenarnya hanya menerima 50% dari total kapasitas drive yang dipasang di server untuk merekam dan menyimpan informasi. Memilih antara RAID 50/60 dan RAID 10 kemungkinan besar akan tergantung pada anggaran Anda, kapasitas server, dan kebutuhan perlindungan data Anda. Dan biaya muncul ketika kita berbicara tentang solusi-SSD (baik kelas korporat dan konsumen).

Adalah sama pentingnya bahwa sekarang kita tahu pasti - RAID berbasis SSD adalah solusi yang sepenuhnya aman dan praktik normal untuk bisnis modern. Sebagai bagian dari penggunaan di rumah, ada juga alasan untuk beralih ke NVMe, jika anggaran memungkinkan. Dan jika Anda masih memiliki pertanyaan, mengapa semua ini diperlukan, kembalilah ke awal artikel - kami telah menjawabnya secara rinci.

Artikel ini disiapkan dengan dukungan rekan Broadcom kami, yang menyediakan pengontrol mereka untuk teknisi Kingston untuk pengujian dengan drive SATA / SAS / NVMe kelas perusahaan. Berkat simbiosis ramah ini, pelanggan tidak perlu meragukan keandalan dan stabilitas drive Kingston dengan HBA dan pengontrol RAID Broadcom.

Informasi tambahan tentang produk Kingston dapat ditemukan di situs web resmi perusahaan.

Source: https://habr.com/ru/post/id482248/


All Articles