Pendahuluan
Saatnya membeli penyimpanan. Yang mana yang harus diambil, siapa yang harus didengarkan? Vendor A berbicara tentang vendor B, dan ada juga integrator C yang mengatakan yang sebaliknya dan menyarankan vendor D. Dalam situasi ini, arsitek penyimpanan yang berpengalaman juga akan berkeliling, terutama dengan semua vendor baru dan SDS saat ini dan hiper-konvergensi.
Jadi, bagaimana Anda mengetahui hal ini dan tidak bodoh? Kami (
AntonVirtual Anton Zhbankov dan
korp Evgeny Elizarov) akan mencoba menceritakan tentang ini dalam bahasa Rusia putih.
Artikel ini memiliki banyak kesamaan, dan sebenarnya merupakan perpanjangan dari "
Desain Pusat Data Virtual " dalam hal pilihan sistem penyimpanan data dan tinjauan teknologi penyimpanan. Kami secara singkat mempertimbangkan teori umum, tetapi kami menyarankan Anda membiasakan diri dengan artikel ini.
Mengapa
Seringkali Anda dapat mengamati situasi ketika seseorang baru datang ke forum atau di ruang obrolan khusus, seperti Storage Discussion dan menanyakan pertanyaan: "di sini saya ditawari dua opsi untuk penyimpanan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apa yang Anda rekomendasikan?"
Dan seseorang mulai mengukur fitur apa dari implementasi chip yang menakutkan dan tidak bisa dipahami, yang bagi orang yang tidak siap, adalah huruf China sama sekali.
Jadi, pertanyaan utama dan pertama yang perlu Anda tanyakan pada diri sendiri jauh sebelum membandingkan spesifikasi dalam penawaran komersial adalah MENGAPA? Mengapa penyimpanan ini diperlukan?

Jawabannya akan tak terduga, dan sangat gaya Tony Robbins - untuk menyimpan data. Kapten terima kasih! Namun demikian, kadang-kadang kita melangkah jauh ke dalam perbandingan detail sehingga kita lupa mengapa kita melakukan semua ini sama sekali.
Jadi, tugas sistem penyimpanan data adalah menyimpan dan menyediakan akses ke DATA dengan kinerja yang diberikan. Kami akan mulai dengan data.
Data
Tipe data
Jenis data apa yang kami rencanakan untuk disimpan? Masalah yang sangat penting yang dapat menghapus banyak sistem penyimpanan bahkan dari pertimbangan. Misalnya, direncanakan untuk menyimpan video dan foto. Anda dapat segera menghapus sistem yang dirancang untuk akses acak dengan blok kecil, atau sistem dengan chip berpemilik dalam kompresi / deduplikasi. Ini bisa menjadi sistem yang sangat baik, kami tidak ingin mengatakan hal buruk. Tetapi dalam hal ini, kekuatan mereka akan menjadi lemah sebaliknya (video dan foto tidak dikompresi) atau hanya secara signifikan meningkatkan biaya sistem.
Sebaliknya, jika penggunaan yang dimaksudkan adalah DBMS transaksional yang dimuat, maka sistem streaming multimedia yang sangat baik yang mampu memberikan gigabytes per detik akan menjadi pilihan yang buruk.
Volume data
Berapa banyak data yang kami rencanakan untuk disimpan? Kuantitas selalu tumbuh menjadi kualitas, ini tidak boleh dilupakan, terutama di masa pertumbuhan volume data yang eksponensial. Sistem kelas Petabyte tidak lagi umum, tetapi semakin banyak petabyte volume, semakin spesifik sistemnya, semakin tidak familiar fungsi sistem dengan akses acak volume kecil dan menengah. Basi karena hanya tabel statistik akses blok yang lebih besar dari RAM yang tersedia pada pengontrol. Belum lagi kompresi / robek. Misalkan kita ingin mengganti algoritma kompresi ke yang lebih kuat dan memeras 20 petabyte data. Berapa lama: setengah tahun, satu tahun?
Di sisi lain, mengapa repot dengan taman jika Anda perlu menyimpan dan memproses 500 GB data? Hanya 500. SSD Rumah Tangga (DWPD rendah) dengan ukuran ini tidak ada biaya sama sekali. Mengapa membangun pabrik Fibre Channel dan membeli sistem penyimpanan eksternal high-end dengan biaya jembatan besi?
Berapa persentase dari total data panas? Seberapa tidak ratakah pemuatan data? Di sinilah teknologi penyimpanan berjenjang atau Flash Cache benar-benar dapat membantu jika jumlah data panas sangat sedikit dibandingkan dengan totalnya. Atau sebaliknya, dengan beban seragam di seluruh volume, sering ditemukan dalam sistem streaming (pengawasan video, beberapa sistem analitik), teknologi seperti itu tidak akan memberikan apa-apa, dan hanya akan menambah biaya / kompleksitas sistem.
IP
Sisi sebaliknya dari data adalah sistem informasi yang menggunakan data ini. IP memiliki seperangkat persyaratan yang mewarisi data. Untuk informasi lebih lanjut tentang IP, lihat "Merancang Pusat Data Virtual".
Persyaratan Kegagalan / Ketersediaan
Persyaratan untuk toleransi kesalahan / ketersediaan data diwarisi dari IS yang menggunakannya dan dinyatakan dalam tiga angka -
RPO ,
RTO ,
ketersediaan .
Ketersediaan - bagian untuk periode waktu tertentu selama data tersedia untuk bekerja dengannya. Biasanya dinyatakan dalam jumlah 9. Misalnya, dua sembilan per tahun berarti ketersediaan 99%, atau 95 jam tidak dapat diaksesnya per tahun jika tidak diizinkan. Tiga sembilan - 9,5 jam setahun.
RPO / RTO - ini bukan ringkasan indikator, tetapi untuk setiap insiden (kecelakaan), yang bertentangan dengan ketersediaan.
RPO - jumlah data yang hilang selama kecelakaan (dalam jam). Misalnya, jika Anda mencadangkan sekali sehari, maka RPO = 24 jam. Yaitu Jika terjadi kecelakaan dan benar-benar kehilangan penyimpanan, data hingga 24 jam dapat hilang (sejak saat pencadangan). Berdasarkan RPO yang ditentukan untuk IS, misalnya, jadwal cadangan ditulis. Selain itu, berdasarkan RPO, Anda dapat memahami berapa banyak replikasi data sinkron / asinkron yang diperlukan.
RTO - waktu pemulihan layanan (akses data) setelah kecelakaan. Berdasarkan nilai RTO yang ditetapkan, kita dapat memahami apakah metro cluster diperlukan, atau replikasi searah sudah cukup. Apakah saya memerlukan kelas penyimpanan multi-pengendali kelas atas - juga.

Persyaratan kinerja
Terlepas dari kenyataan bahwa ini adalah pertanyaan yang sangat jelas, sebagian besar kesulitan muncul bersamanya. Bergantung pada apakah Anda sudah memiliki semacam infrastruktur atau tidak, dan cara untuk mengumpulkan statistik yang diperlukan akan dibangun.
Anda sudah memiliki sistem penyimpanan dan Anda mencari penggantinya atau ingin membeli yang lain untuk ekspansi. Semuanya sederhana di sini. Anda memahami layanan apa yang sudah Anda miliki dan layanan apa yang akan Anda implementasikan dalam waktu dekat. Berdasarkan layanan saat ini, Anda memiliki kesempatan untuk mengumpulkan statistik kinerja. Tentukan jumlah IOPS saat ini dan penundaan saat ini - apa indikator ini dan apakah ada cukup untuk tugas Anda? Ini dapat dilakukan baik pada sistem penyimpanan data itu sendiri maupun pada bagian host yang terhubung dengannya.
Selain itu, Anda perlu menonton tidak hanya beban saat ini, tetapi untuk beberapa periode (sebulan lebih baik). Lihat apa puncak maksimum di siang hari, seperti apa beban yang dibuat cadangan, dll. Jika penyimpanan atau perangkat lunak Anda untuk itu tidak memberi Anda satu set lengkap data ini, Anda dapat menggunakan RRDtool gratis, yang dapat bekerja dengan sebagian besar penyimpanan dan sakelar paling populer dan dapat memberi Anda statistik kinerja terperinci. Penting juga melihat beban pada host yang bekerja dengan sistem penyimpanan ini, pada mesin virtual tertentu, atau apa yang sebenarnya bekerja untuk Anda pada host ini.

Perlu dicatat secara terpisah bahwa jika keterlambatan volume dan datastore yang terletak pada volume ini sangat berbeda - ada baiknya memperhatikan jaringan SAN Anda, ada kemungkinan ada masalah dengan itu dan sebelum mendapatkan sistem baru, Anda harus berurusan dengan masalah ini , karena probabilitas peningkatan kinerja sistem saat ini sangat tinggi.
Anda membangun infrastruktur dari awal, atau membeli sistem untuk beberapa jenis layanan baru, yang tidak Anda sadari. Ada beberapa opsi: berkomunikasi dengan kolega tentang sumber daya khusus untuk mencoba mencari tahu dan memprediksi beban, hubungi integrator yang memiliki pengalaman menerapkan layanan tersebut dan siapa yang dapat menghitung beban untuk Anda. Dan opsi ketiga (biasanya yang paling sulit, terutama ketika datang ke aplikasi yang ditulis sendiri atau jarang) adalah mencoba mencari tahu persyaratan kinerja pengembang sistem.
Dan, perhatian, opsi yang paling benar dari sudut pandang aplikasi praktis adalah pilot pada peralatan saat ini, atau peralatan yang disediakan untuk pengujian oleh vendor / integrator.
Persyaratan khusus
Persyaratan khusus - semua yang tidak termasuk dalam persyaratan kinerja, toleransi kesalahan dan fungsionalitas untuk pemrosesan langsung dan penyediaan data.
Salah satu persyaratan khusus yang paling sederhana untuk sistem penyimpanan data adalah "media penyimpanan terasing". Dan segera menjadi jelas bahwa sistem penyimpanan data ini harus menyertakan perpustakaan tape atau hanya drive tape, di mana cadangan diatur ulang. Kemudian seseorang yang terlatih secara khusus menandatangani kaset itu dan dengan bangga membawanya dalam brankas khusus.
Contoh lain dari persyaratan khusus adalah kinerja yang tahan guncangan.
Dimana
Komponen utama kedua dalam memilih satu atau beberapa sistem penyimpanan adalah informasi tentang DI MANA sistem penyimpanan ini. Mulai dari kondisi geografi atau iklim, dan diakhiri dengan staf.
Pelanggan
Untuk siapa penyimpanan ini direncanakan? Pertanyaannya memiliki alasan berikut:
Pelanggan pemerintah / komersial.Pelanggan komersial tidak memiliki batasan apa pun, dan bahkan tidak berkewajiban untuk melakukan tender, kecuali menurut peraturan internalnya sendiri.
Pelanggan negara adalah masalah yang berbeda. 44 Hukum Federal dan kesenangan lainnya dengan tender dan TK, yang dapat ditentang.
Pelanggan dikenai sanksiNah, di sini pertanyaannya sangat sederhana - pilihannya hanya dibatasi oleh penawaran yang tersedia untuk pelanggan ini.
Peraturan internal / vendor / model yang disetujuiPertanyaannya juga sangat sederhana, tetapi kita harus mengingatnya.
Di mana secara fisik
Pada bagian ini, kami mempertimbangkan semua masalah dengan geografi, saluran komunikasi, dan iklim dalam ruangan.
Staf
Siapa yang akan bekerja dengan penyimpanan ini? Ini tidak kalah penting dari apa yang dapat dilakukan SHD secara langsung.
Tidak peduli seberapa menjanjikan, keren, dan hebatnya sistem penyimpanan dari vendor A, mungkin ada sedikit gunanya jika staf hanya dapat bekerja dengan vendor B, dan tidak ada rencana untuk pembelian lebih lanjut dan kerja sama berkelanjutan dengan A.
Dan tentu saja, sisi lain dari pertanyaannya adalah bagaimana dapat diaksesnya personil terlatih secara langsung di perusahaan dan berpotensi di pasar tenaga kerja di lokasi geografis ini. Untuk wilayah, pilihan sistem penyimpanan dengan antarmuka yang sederhana atau kemungkinan manajemen terpusat jarak jauh dapat masuk akal. Kalau tidak, pada titik tertentu itu bisa menjadi menyakitkan menyakitkan. Internet penuh dengan cerita ketika seorang karyawan baru, siswa kemarin, datang dengan konfigurasi sehingga seluruh kantor terbunuh.

Lingkungan
Yah, tentu saja, pertanyaan penting adalah lingkungan tempat penyimpanan ini akan bekerja.
- Bagaimana dengan daya / pendinginan?
- Koneksi apa
- Di mana akan dipasang
- Dan sebagainya.
Seringkali masalah-masalah ini diterima begitu saja dan tidak secara khusus ditangani, tetapi kadang-kadang mereka dapat membalikkan segala sesuatu yang sebaliknya.
Apa
Vendor
Hari ini (pertengahan 2019), pasar penyimpanan Rusia dapat dibagi menjadi 5 kategori bersyarat:
- Divisi teratas - perusahaan yang layak menerima berbagai macam mulai dari rak disk paling sederhana hingga hi-end (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
- Divisi kedua - perusahaan dengan lineup terbatas, pemain khusus, vendor SDS serius atau pendatang baru yang sedang naik daun (Fujitsu, Datacore, Infinidat, Huawei, Pure, dll.)
- Divisi ketiga - solusi niche di peringkat low end, SDS murah, praktik yang baik pada ceph dan proyek terbuka lainnya (Infortrend, Starwind, dll.)
- Segmen SOHO - sistem penyimpanan kecil dan sangat kecil di tingkat rumah / kantor kecil (Synology, QNAP, dll.)
- Sistem penyimpanan yang diganti impor - ini termasuk setrika divisi pertama dengan label terpaku dan perwakilan langka dari yang kedua (RAIDIX, mari beri mereka kemajuan di divisi kedua), tetapi sebagian besar ini adalah divisi ketiga (Aerodisk, Baum, Depo, dll.)
Divisi ini agak sewenang-wenang, dan tidak berarti sama sekali bahwa segmen ketiga atau SOHO buruk dan tidak dapat digunakan. Dalam proyek spesifik dengan kumpulan data dan profil pemuatan yang jelas, mereka dapat bekerja dengan sangat baik, jauh melampaui divisi pertama dalam hal rasio harga / kualitas. Penting untuk terlebih dahulu memutuskan tugas, prospek pertumbuhan, fungsionalitas yang diperlukan - dan kemudian Synology akan melayani Anda dengan setia, dan rambut Anda akan menjadi lembut dan halus.
Salah satu faktor penting ketika memilih vendor adalah lingkungan saat ini. Berapa banyak dan sistem penyimpanan mana yang sudah Anda miliki, sistem penyimpanan apa yang dapat digunakan insinyur. Apakah Anda memerlukan vendor lain, titik kontak lain, akankah Anda secara bertahap memigrasikan seluruh beban dari vendor A ke vendor B?
Tidak perlu menghasilkan entitas di luar apa yang diperlukan.
iSCSI / FC / File
Pada masalah protokol akses, tidak ada konsensus di antara para insinyur, dan perselisihan lebih menyerupai diskusi teologis daripada yang rekayasa. Namun secara umum, poin-poin berikut dapat dicatat:
FCoE lebih mungkin mati daripada hidup.
FC vs iSCSI . Salah satu keunggulan utama FC pada 2019 dibandingkan penyimpanan IP, pabrik khusus untuk akses data, diratakan oleh jaringan IP khusus. FC tidak memiliki keunggulan global dibandingkan jaringan IP dan IP dapat digunakan untuk membangun sistem penyimpanan pada tingkat beban apa pun, hingga sistem untuk DBMS berat untuk ABS bank besar. Di sisi lain, kematian FC telah dinubuatkan bukan untuk tahun pertama, tetapi sesuatu yang terus-menerus mengganggu ini. Saat ini, misalnya, beberapa pemain di pasar penyimpanan aktif mengembangkan standar NVMEoF. Apakah dia berbagi nasib FCoE - waktu akan memberi tahu.
Akses file juga tidak layak diperhatikan. NFS / CIFS bekerja dengan baik di lingkungan yang produktif dan, jika dirancang dengan baik, tidak memiliki keluhan lebih dari protokol blok.
Hibrida / Semua Array Flash
Sistem penyimpanan klasik terdiri dari 2 jenis:
- AFA (All Flash Array) - sistem yang dioptimalkan untuk menggunakan SSD.
- Hibrida - memungkinkan Anda menggunakan HDD dan SSD, atau kombinasi keduanya.
Perbedaan utama mereka adalah teknologi efisiensi penyimpanan yang didukung dan tingkat kinerja maksimum (IOPS tinggi dan latensi rendah). Baik itu dan sistem lain (dalam sebagian besar model mereka, tidak termasuk segmen low-end) dapat mengoperasikan perangkat blok dan perangkat file. Fungsionalitas yang didukung dan model yang lebih muda juga tergantung pada tingkat sistem, yang paling sering dipotong ke tingkat minimum. Anda harus memperhatikan hal ini ketika Anda mempelajari karakteristik model tertentu, dan bukan hanya kemampuan seluruh lini secara keseluruhan. Selain itu, tentu saja, karakteristik teknisnya bergantung pada tingkat sistem, seperti prosesor, jumlah memori, cache, jumlah dan jenis port, dll. Dari sudut pandang Manajemen, AFA dari sistem hybrid (disk) hanya berbeda dalam implementasi mekanisme untuk bekerja dengan drive SSD, dan bahkan jika Anda menggunakan SSD dalam sistem hybrid, ini tidak berarti bahwa Anda bisa mendapatkan tingkat kinerja pada level AFA dari sistem. . Juga, dalam banyak kasus, mekanisme inline untuk penyimpanan efisien pada sistem hybrid dinonaktifkan, dan inklusi mereka menyebabkan hilangnya kinerja.
Penyimpanan khusus
Selain penyimpanan untuk keperluan umum, yang berfokus terutama pada pemrosesan data operasional, ada sistem penyimpanan khusus dengan prinsip-prinsip kunci yang secara fundamental berbeda dari yang biasa (latensi rendah, banyak IOPS):
MediaSistem ini dirancang untuk penyimpanan dan pemrosesan file media yang berukuran besar. Acc. penundaan menjadi praktis tidak penting, dan kemampuan untuk mengirim dan menerima data dalam pita lebar di banyak aliran paralel datang ke permukaan.
Penyimpanan duplikat untuk cadangan.Karena cadangan berbeda dalam hal keramahan, yang jarang terjadi dalam keadaan biasa (cadangan rata-rata berbeda dari kemarin sebesar 1-2%), kelas sistem ini sangat efisien mengemas data yang direkam pada mereka dalam sejumlah kecil media fisik. Misalnya, dalam beberapa kasus, rasio kompresi data dapat mencapai 200 banding 1.
Penyimpanan ObjekSistem penyimpanan ini tidak memiliki volume yang biasa dengan akses blok dan file bola, dan yang paling penting mereka menyerupai database besar. Akses ke objek yang disimpan dalam sistem tersebut dilakukan oleh pengidentifikasi unik atau dengan metadata (misalnya, semua objek dalam format JPEG, dengan tanggal pembuatan antara XX-XX-XXXX dan YY-YY-YYYY).
Sistem kepatuhan .
Tidak begitu sering ditemukan di Rusia saat ini, tetapi perlu disebutkan. Tujuan dari sistem penyimpanan ini adalah penyimpanan data yang dijamin untuk kepatuhan terhadap kebijakan keamanan atau persyaratan peraturan. Dalam beberapa sistem (misalnya, EMC Centera), fungsi melarang penghapusan data diimplementasikan - segera setelah kunci diputar dan sistem beralih ke mode ini, baik administrator, maupun orang lain, secara fisik dapat menghapus data yang sudah direkam.
Teknologi eksklusif
Cache flash
Flash Cache adalah nama umum untuk semua teknologi kepemilikan untuk menggunakan memori flash sebagai cache level kedua. Saat menggunakan cache flash, penyimpanan biasanya dihitung untuk memberikan beban yang stabil dari disk magnetik, sementara cache puncak melayani beban puncak.
Penting untuk memahami profil pemuatan dan tingkat lokalisasi panggilan ke blok volume penyimpanan. Cache Flash adalah teknologi untuk memuat dengan lokalisasi permintaan yang tinggi, dan secara praktis tidak berlaku untuk volume yang dimuat secara merata (seperti untuk sistem analitik).
Dua implementasi cache flash tersedia di pasar:
- Baca Saja. Dalam hal ini, hanya baca data yang di-cache, dan penulisan langsung masuk ke disk. Beberapa produsen, seperti NetApp, percaya bahwa menulis ke sistem penyimpanan mereka adalah optimal, dan cache tidak akan membantu.
- Baca / Tulis. Tidak hanya membaca tetapi juga menulis di-cache, yang memungkinkan Anda untuk menyangga aliran dan mengurangi dampak Penalti RAID, dan sebagai hasilnya, meningkatkan kinerja keseluruhan untuk penyimpanan tanpa mekanisme penulisan yang optimal.
Tingkat
Penyimpanan multilevel (merobek) adalah teknologi menggabungkan level ke dalam satu disk pool dengan kinerja yang berbeda, seperti SSD dan HDD. Dalam kasus ketidakseragaman yang nyata dari akses ke blok data, sistem akan dapat secara otomatis menyeimbangkan blok data dengan memindahkan yang dimuat ke tingkat kinerja tinggi, dan yang dingin, sebaliknya, ke yang lebih lambat.Sistem hibrida dari kelas bawah dan menengah menggunakan penyimpanan berjenjang dengan memindahkan data antar level dalam suatu jadwal. Pada saat yang sama, ukuran blok penyimpanan berjenjang dari model terbaik adalah 256 MB. Fitur-fitur ini tidak memungkinkan kami untuk mempertimbangkan teknologi penyimpanan bertingkat sebagai teknologi untuk meningkatkan produktivitas, seperti yang secara keliru dianggap oleh banyak orang. Penyimpanan bertingkat di sistem kelas bawah dan menengah adalah teknologi untuk mengoptimalkan biaya penyimpanan untuk sistem dengan ketidakrataan beban yang nyata.Jepretan
Tidak peduli seberapa banyak kita berbicara tentang keandalan penyimpanan, ada banyak peluang untuk kehilangan data yang tidak bergantung pada masalah perangkat keras. Itu bisa seperti virus, peretas atau lainnya, penghapusan / korupsi data yang tidak disengaja. Karena alasan ini, membuat cadangan data produktif adalah bagian integral dari pekerjaan insinyur.Snapshot adalah snapshot volume di beberapa titik waktu. Ketika bekerja dengan sebagian besar sistem, seperti virtualisasi, database, dll. kita perlu mengambil snapshot dari mana kita akan menyalin data ke salinan cadangan, sementara IP kita dapat terus bekerja dengan aman dengan volume ini. Tetapi perlu diingat - tidak semua snapshot sama bermanfaatnya. Vendor yang berbeda memiliki pendekatan berbeda untuk membuat foto yang terkait dengan arsitektur mereka.KK (Copy-On-Write). Saat Anda mencoba menulis blok data, konten aslinya disalin ke area khusus, setelah itu perekamannya normal. Ini mencegah korupsi data di dalam snapshot. Secara alami, semua manipulasi data "parasit" ini menyebabkan beban tambahan pada sistem penyimpanan dan untuk alasan ini vendor dengan implementasi yang sama tidak merekomendasikan menggunakan lebih dari selusin foto, dan tidak menggunakannya sama sekali pada volume yang sangat dimuat.RoW (Redirect-on-Write). Dalam kasus ini, volume asli dibekukan secara alami, dan ketika Anda mencoba menulis blok data, sistem penyimpanan menulis data ke area khusus di ruang kosong, mengubah lokasi blok ini di tabel metadata. Ini memungkinkan Anda untuk mengurangi jumlah operasi penulisan ulang, yang pada akhirnya menghilangkan penurunan kinerja dan menghilangkan pembatasan pada snapshot dan jumlahnya.Ada juga dua jenis snapshot sehubungan dengan aplikasi:Aplikasi konsiten . Pada saat membuat snapshot, sistem penyimpanan menarik agen di sistem operasi konsumen, yang secara paksa membuang cache disk dari memori ke disk dan memaksa aplikasi ini dibuat. Dalam hal ini, saat memulihkan dari snapshot, data akan konsisten.Kecelakaan konsisten. Dalam hal ini, tidak ada yang seperti ini yang terjadi dan snapshot dibuat apa adanya. Dalam kasus pemulihan dari snapshot seperti itu, gambar tersebut identik seolah-olah daya tiba-tiba mati dan mungkin ada beberapa kehilangan data yang menggantung di cache dan tidak mencapai disk. Snapshots seperti itu lebih mudah diimplementasikan dan tidak menyebabkan penurunan kinerja dalam aplikasi, tetapi kurang dapat diandalkan.Mengapa snapshot diperlukan pada sistem penyimpanan?- Cadangan tanpa agen langsung dari penyimpanan
- Menciptakan lingkungan pengujian berdasarkan data nyata
- Dalam hal penyimpanan file, ini dapat digunakan untuk membuat lingkungan VDI dengan menggunakan snapshot penyimpanan alih-alih hypervisor.
- Memastikan RPO rendah dengan membuat snapshot terjadwal pada frekuensi secara signifikan lebih tinggi dari frekuensi cadangan
Kloning
Mengkloning volume - bekerja berdasarkan prinsip yang sama dengan snapshot, tetapi berfungsi tidak hanya untuk membaca data, tetapi juga untuk sepenuhnya bekerja dengannya. Kami bisa mendapatkan salinan persis volume kami, dengan semua data di dalamnya, tanpa membuat salinan fisik, yang akan menghemat ruang. Biasanya, kloning volume digunakan dalam Test & Dev atau jika Anda ingin memeriksa fungsionalitas beberapa pembaruan pada IS Anda. Kloning akan memungkinkan Anda untuk melakukan ini secepat dan ekonomis mungkin dalam hal sumber daya disk, seperti hanya blok data yang dimodifikasi yang akan ditulis.Replikasi / Jurnal
Replikasi adalah mekanisme untuk membuat salinan data pada sistem penyimpanan fisik lain. Biasanya, ada teknologi eksklusif untuk masing-masing vendor yang hanya berfungsi dalam jalurnya sendiri. Tetapi ada juga solusi pihak ketiga, termasuk yang bekerja di tingkat hypervisor, seperti Replikasi VMware vSphere.Fungsionalitas teknologi yang dipatenkan dan kegunaannya biasanya jauh lebih unggul dari yang universal, tetapi tidak berlaku ketika, misalnya, Anda perlu membuat replika dari NetApp ke HP MSA.Replikasi dibagi menjadi dua subspesies:Sinkron . Dalam kasus replikasi sinkron, operasi tulis dikirim ke sistem penyimpanan kedua segera dan eksekusi tidak dikonfirmasi sampai sistem penyimpanan jarak jauh mengonfirmasikannya. Karena hal ini, penundaan akses meningkat, tetapi kami memiliki salinan persis data. Yaitu
RPO = 0 untuk kasus kehilangan penyimpanan primer.Tidak sinkron . Operasi penulisan dilakukan hanya pada sistem penyimpanan utama dan dikonfirmasi segera, secara bersamaan terakumulasi dalam buffer untuk pengiriman paket ke sistem penyimpanan jarak jauh. Jenis replikasi ini relevan untuk data yang kurang berharga, baik untuk saluran bandwidth rendah atau memiliki penundaan tinggi (khas untuk jarak lebih dari 100 km). Masing-masing RPO = frekuensi pengiriman paket.Seringkali ada mekanisme logging dengan replikasioperasi disk. Dalam hal ini, area khusus untuk logging dialokasikan dan operasi pencatatan dengan kedalaman waktu tertentu, atau dibatasi oleh volume log, disimpan. Untuk teknologi eksklusif tertentu, seperti EMC RecoverPoint, ada integrasi dengan perangkat lunak sistem yang memungkinkan Anda untuk mengikat penanda tertentu ke entri jurnal tertentu. Berkat ini, dimungkinkan untuk memutar kembali keadaan volume (atau membuat klon) tidak hanya pada 23 April 11 jam 59 detik 13 milidetik, tetapi pada saat sebelumnya "DROP ALL TABLES; KOMIT. āCluster metro
Metro cluster adalah teknologi yang memungkinkan Anda membuat replikasi sinkron dua arah antara dua sistem penyimpanan sedemikian rupa sehingga dari sisi pasangan ini terlihat seperti satu sistem penyimpanan. Ini digunakan untuk membuat cluster dengan bahu geografis pada jarak metro (kurang dari 100 km).Menggunakan contoh di lingkungan virtualisasi, sebuah cluster metro memungkinkan Anda membuat datastore dengan mesin virtual yang dapat direkam langsung dari dua pusat data. Dalam kasus ini, sebuah cluster dibuat di tingkat hypervisor, yang terdiri dari host di pusat data fisik yang berbeda, yang terhubung ke datastore ini. Yang memungkinkan Anda melakukan hal berikut:- . , , . RTO = (15 VMware) + .
- Disaster avoidance , -, . 1, , , 2 .
Virtualisasi penyimpanan secara teknis menggunakan volume dari sistem penyimpanan lain sebagai disk. Sistem penyimpanan yang tervirtualisasi dapat dengan mudah mendorong volume asing ke konsumen sebagai miliknya, secara simultan mencerminkannya ke sistem penyimpanan lain, atau bahkan membuat RAID dari volume eksternal.Perwakilan klasik di kelas virtualisasi penyimpanan adalah EMC VPLEX dan IBM SVC. Yah, tentu saja, penyimpanan dengan virtualisasi - NetApp, Hitachi, IBM / Lenovo Storwize.Mengapa Anda membutuhkannya?- Redundansi di tingkat penyimpanan. Cermin dibuat di antara volume, dengan satu setengah berada di HP 3Par dan yang lainnya di NetApp. Sebuah virtualizer dari EMC.
- . , 3Par, , Dell. 3Par, VPLEX . , . Dell, 3Par .
- .
/
Kompresi dan deduplikasi adalah teknologi yang memungkinkan Anda menghemat ruang disk di penyimpanan Anda. Perlu disebutkan segera bahwa jauh dari semua data tunduk pada kompresi dan / atau deduplikasi pada prinsipnya, sementara beberapa jenis data dikompresi dan didupuplikasi lebih baik, dan beberapa sebaliknya.Ada 2 jenis kompresi dan deduplikasi :Inline - blok data dikompresi dan didupuplikasi sebelum data ini ditulis ke disk. Dengan demikian, sistem hanya menghitung hash dari blok dan membandingkannya sesuai dengan tabel dengan yang ada. Pertama, ini lebih cepat dari hanya menulis ke disk, dan kedua, kami tidak mengkonsumsi ruang disk tambahan.Posting- ketika operasi ini sudah dilakukan pada data yang direkam yang ada di disk. Dengan demikian, data pertama kali ditulis ke disk, dan hanya kemudian, hash dihitung dan blok tambahan dihapus dan sumber daya disk dibebaskan.Perlu dikatakan bahwa sebagian besar vendor menggunakan kedua jenis ini, yang memungkinkan Anda untuk mengoptimalkan proses ini dan dengan demikian meningkatkan efisiensinya. Sebagian besar vendor penyimpanan memiliki utilitas yang memungkinkan Anda menganalisis kumpulan data Anda. Utilitas ini bekerja sesuai dengan logika yang sama yang diterapkan dalam sistem penyimpanan, oleh karena itu, perkiraan tingkat efisiensi akan bersamaan. Juga, jangan lupa bahwa banyak vendor memiliki program jaminan efisiensi yang menjanjikan level tidak lebih rendah dari yang dinyatakan untuk tipe data tertentu (atau semua). Dan jangan mengabaikan program ini, karena dengan menghitung sistem untuk tugas-tugas Anda, dengan mempertimbangkan koefisien efisiensi dari sistem tertentu, Anda dapat menghemat volume. Perlu juga dipertimbangkan bahwa program ini dirancang untuk sistem AFA, tetapi berkat pembelian volume SSD yang lebih kecil,daripada HDD dalam sistem klasik, ini akan mengurangi biaya mereka, dan jika Anda tidak membandingkannya dengan biaya sistem disk, maka itu akan mendekati itu.Model
Dan di sini kita sampai pada pertanyaan yang tepat."Di sini saya menawarkan dua opsi untuk penyimpanan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apa yang Anda rekomendasikan?Beralih ke" Di sini saya menawarkan dua opsi untuk penyimpanan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apa yang Anda sarankan?Target memuat mesin virtual VMware campuran dengan loop produktif / pengujian / pengembangan. Tes = produktif. 150 TB masing-masing dengan kinerja puncak 80.000 IOPS 8kb blok 50% akses acak 80/20 baca-tulis. 300 TB untuk pengembangan, ada cukup 50.000 IOPS, 80 acak, 80 entri.Diharapkan menjadi produktif dalam cluster metro RPO = 15 menit RTO = 1 jam, pengembangan dalam replikasi asinkron RPO = 3 jam, tes di satu situs.Akan ada 50TB DBMS, alangkah baiknya bagi mereka untuk login.Kami memiliki server Dell di mana-mana, sistem penyimpanan Hitachi yang lama, hampir tidak dapat mengatasinya, kami berencana untuk meningkatkan 50% dari beban dalam hal volume dan kinerja. āSeperti yang mereka katakan, pertanyaan yang dirumuskan dengan benar mengandung 80% dari jawabannya.Informasi tambahan
Apa yang harus Anda biasakan dengan tambahan menurut penulisBuku
- Olifer dan Olifer "Jaringan Komputer". Buku ini akan membantu mensistematisasikan dan mungkin lebih memahami bagaimana media transmisi data bekerja untuk sistem penyimpanan IP / Ethernet.
- "Penyimpanan dan Manajemen Informasi EMC". Buku yang bagus tentang dasar-dasar penyimpanan, mengapa, bagaimana dan mengapa.
Forum dan obrolan
Rekomendasi umum
Harga
ā , List price, . , , , . , low-end , ,
nix.ru xcom-shop.ru . , .
, TB/$ . , JBOD + , , , , . , JBOD , - ā . , JBOD , . . .
Total
Membandingkan sistem satu sama lain diperlukan tidak hanya oleh harga, atau tidak hanya oleh produktivitas, tetapi oleh totalitas semua indikator.
Beli HDD hanya jika Anda yakin membutuhkan HDD. Untuk beban rendah dan tipe data yang tidak dapat dimampatkan, dalam kasus sebaliknya, ada baiknya memperhatikan program jaminan efisiensi penyimpanan SSD yang dimiliki sebagian besar vendor (dan mereka benar-benar bekerja, bahkan di Rusia), tetapi semuanya tergantung pada aplikasi dan data yang akan terletak di penyimpanan ini.
Jangan mengejar murahnya. Terkadang banyak momen tidak menyenangkan yang tersembunyi di bawah ini, salah satunya dijelaskan Yevgeny Elizarov dalam artikelnya tentang
Infortrend . Dan itu, pada akhirnya, murahnya ini bisa datang ke pihak Anda. Jangan lupa - "ketamakan membayar dua kali."