Cara memadatkan hingga 90% penyimpanan cadangan dalam penyimpanan objek

Klien Turki kami meminta kami untuk mengonfigurasi cadangan untuk pusat data dengan benar. Kami sedang melakukan proyek serupa di Rusia, tetapi di sinilah ceritanya lebih tentang meneliti cara terbaik untuk melakukannya.

Mengingat: ada penyimpanan S3 lokal, ada Veritas NetBackup, yang telah memperoleh fungsionalitas canggih baru untuk memindahkan data ke penyimpanan objek sekarang dengan dukungan deduplikasi, dan ada masalah dengan ruang kosong di penyimpanan lokal ini.

Tujuan: untuk membuat semuanya sehingga proses penyimpanan cadangan cepat dan murah.

Sebenarnya, sebelum itu, dalam S3 semuanya hanya file, dan ini adalah cetakan lengkap dari mesin pusat data penting. Itu tidak begitu sangat dioptimalkan, tetapi semuanya bekerja pada awalnya. Sekarang saatnya untuk mencari tahu dan melakukannya dengan benar.

Dalam gambar, apa yang telah kita ketahui:



Seperti yang Anda lihat, cadangan pertama dilakukan secara lambat (70 Mb / s), dan cadangan selanjutnya dari sistem yang sama jauh lebih cepat.

Sebenarnya, lebih jauh sedikit lebih detail tentang fitur apa saja yang ada.

Cadangan log untuk mereka yang siap membaca setengah halaman dump
Penuh dengan pemindaian ulang
18 Des 2018 12:09:43 PM - Info akselerator bpbkar (pid = 4452) mengirim 14883996160 byte dari 14883994624 byte ke server, pengoptimalan 0,0%
18 Des 2018 12:10:07 PM - Info NBCC (pid = 23002) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Laporan = Statistik PDDO (aliran multi-utas digunakan) untuk (NBCC): dipindai: 14570817 KB, CR dikirim: 1760761 KB, CR dikirim melalui FC: 0 KB, dedup: 87,9%, cache dinonaktifkan

Penuh
18 Des 2018 12:13:18 PM - Info akselerator bpbkar (pid = 2864) mengirim 181675008 byte dari 14884060160 byte ke server, optimalisasi 98,8%
18 Des 2018 12:13:40 - Info NBCC (pid = 23527) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Laporan = Statistik PDDO untuk (NBCC): dipindai: 14569706 KB, CR dikirim: 45145 KB, CR dikirim melalui FC: 0 KB, dedup: 99,7%, cache dinonaktifkan

Inkremental
18 Des 2018 12:15:32 PM - Info akselerator bpbkar (pid = 792) mengirim 9970688 byte dari 14726108160 byte ke server, optimalisasi 99,9%
18 Des 2018 12:15:53 ​​PM - Info NBCC (pid = 23656) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Laporan = Statistik PDDO untuk (NBCC): dipindai: 14383788 KB, CR dikirim: 15700 KB, CR dikirim melalui FC: 0 KB, dedup: 99,9%, cache dinonaktifkan

Penuh
18 Des 2018 12:18:02 PM - Info bpbkar (pid = 3496) akselerator mengirim 171746816 byte dari 14884093952 byte ke server, optimalisasi 98,8%
18 Des 2018 12:18:24 PM - Info NBCC (pid = 23878) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Laporan = Statistik PDDO untuk (NBCC): dipindai: 14569739 KB, CR dikirim: 34120 KB, CR dikirim melalui FC: 0 KB, dedup: 99,8%, cache dinonaktifkan


Apa masalahnya?


Pelanggan ingin mencadangkan sesering mungkin dan menyimpan semurah mungkin. Adalah murah untuk menyimpannya paling baik dalam penyimpanan objek tipe S3, karena mereka adalah yang termurah dengan harga pemeliharaan per megabyte dari tempat Anda dapat menggulung kembali dalam jumlah waktu yang wajar. Ketika ada banyak cadangan, itu menjadi tidak terlalu murah, karena sebagian besar penyimpanan ditempati oleh salinan dari data yang sama. Dalam kasus HaaS dari kolega Turki, penyimpanan dapat dipadatkan sekitar 80-90%. Jelas bahwa ini berlaku khusus untuk spesifikasinya, tetapi saya pasti akan mengandalkan setidaknya 50% dari dedup.

Untuk mengatasi masalah tersebut, vendor utama telah lama membuat gateway di Amazon S3. Semua metode mereka kompatibel dengan S3 lokal jika mereka mendukung API Amazon. Di pusat data Turki, cadangan dilakukan di S3 kami, serta di "Kompresor" T-III di Rusia, karena skema kerja seperti itu terbukti baik bagi kami.

Dan S3 kami sepenuhnya kompatibel dengan metode cadangan di Amazon S3. Yaitu, semua alat cadangan yang mendukung metode ini memungkinkan Anda untuk menyalin semuanya ke penyimpanan "di luar kotak".

Veritas NetBackup membuat fitur CloudCatalyst:



Yaitu, antara mesin yang perlu dicadangkan dan gateway ada server Linux perantara yang melaluinya lalu lintas cadangan dari agen CPC dilewati dan deduplikasi dilakukan dengan cepat sebelum mentransfernya ke S3. Jika sebelum ada 30 cadangan masing-masing 20 GB dengan kompresi, sekarang (karena kesamaan mesin) mereka telah menjadi 90% lebih kecil dalam volume. Mesin deduplikasi digunakan sama seperti ketika disimpan pada disk biasa menggunakan Netbackup.

Inilah yang terjadi sebelum server pementasan:



Kami menguji dan sampai pada kesimpulan bahwa ketika diimplementasikan di pusat data kami, ini menghemat ruang penyimpanan S3 untuk kami dan untuk pelanggan. Sebagai pemilik pusat data komersial, tentu saja, kami membebankan biaya untuk volume yang ditempati, tetapi tetap sangat bermanfaat bagi kami juga - karena kami mulai mendapatkan penghasilan di tempat yang lebih skalabel dalam perangkat lunak, dan bukan pada penyewaan besi. Nah, ini adalah pengurangan biaya internal.

Log
228 Pekerjaan (0 Antri 0 Aktif 0 Menunggu Coba Lagi 0 Ditangguhkan 0 Tidak selesai 228 Selesai - 13 dipilih)
(Filter Diterapkan [13])

Jenis Id Pekerjaan Status Negara Detail Status Kebijakan Pekerjaan Jadwal Kerja Klien Media Server Mulai Waktu Berlalu Waktu Berakhir Unit Penyimpanan Mencoba Usaha Kilobyte File Pathname% Lengkap (Perkiraan) Pekerjaan PID Pemilik Menyalin Induk ID Pekerjaan KB / Detik Mulai Aktif Aktif Telah Berlalu Robot Vault Sesi Profil ID Media untuk Mengeluarkan Gerakan Data Jenis Host Off-Master Tingkat Deduplikasi Transport Angka Optimasi Akselerator Transport atau Host Berbagi Database
- 1358 Snapshot Selesai 0 VMware - NGNCloudADC NBCC 18 Des, 2018 12:16:19 PM 00:02:18 18 Desember, 2018 12:18:37 PM STU_DP_S3 _ **** cadangan 1 100% root 1358 18 Desember 18, 2018 12 : 16: 27 PM 00:02:10 Standar Disk Pemulihan Instan MENANG - *********** 0
1360 Cadangan Selesai 0 VMware NGNCloudADC NBCC Lengkap 18 Des, 2018 12:16:48 PM 00:01:39 18 Des, 2018 12:18:27 PM STU_DP_S3 _ **** cadangan 1 14.535.248 149654 100% 23858 root 1358 335.098 18 Desember , 2018 12:16:48 PM 00:01:39 Standar Disk Pemulihan Instan MENANG - *********** 0 99,8% 99%
1352 Snapshot Selesai 0 VMware - NGNCloudADC NBCC 18 Des, 2018 12:14:04 PM 00:02:01 PM 18 Desember, 2018 12:16:05 PM STU_DP_S3 _ **** cadangan 1 100% root 1352 18 Desember 18, 2018 12:: 14:14 PM 00:01:51 Standar Disk Pemulihan Instan MENANG - *********** 0
1354 Cadangan Selesai 0 VMware Incremental NGNCloudADC NBCC 18 Des, 2018 12:14:34 PM 00:01:21 18 Desember, 2018 12:15:55 PM STU_DP_S3 _ **** cadangan 1 14.380.965 147 100% 23617 root 1352 500.817 Des 18 , 2018 12:14:34 PM 00:01:21 Standar Disk Pemulihan Instan MENANG - *********** 0 99,9% 100%
1347 Snapshot Selesai 0 VMware - NGNCloudADC NBCC 18 Des, 2018 12:11:45 PM 00:02:08 PM 18 Desember, 2018 12:13:53 PM STU_DP_S3 _ **** cadangan 1 100% root 1347 Des 18, 2018 12:: 11:45 PM 00:02:08 Standar Disk Pemulihan Instan MENANG - *********** 0
1349 Cadangan Selesai 0 VMware NGNCloudADC NBCC Lengkap 18 Des, 2018 12:12:02 PM 00:01:41 18 Des, 2018 12:13:43 PM STU_DP_S3 _ **** cadangan 1 14.535.215 149653 100% 23508 root 1347 316.319 Des 18 , 2018 12:12:02 PM 00:01:41 Standar Disk Pemulihan Instan MENANG - *********** 0 99,7% 99%
1341 Snapshot Selesai 0 VMware - NGNCloudADC NBCC 18 Des, 2018 12:05:28 PM 00:04:53 PM 18:04, 2018 12:10:21 PM STU_DP_S3 _ **** cadangan 1 akar 100% 1341 Des 18, 2018 12:: 05:28 PM 00:04:53 Standar Disk Pemulihan Instan MENANG - *********** 0
1342 Cadangan Selesai 0 VMware Full_Rescan NGNCloudADC NBCC 18 Des, 2018 12:05:47 PM 00:04:24 18 Des, 2018 12:10:11 PM STU_DP_S3 _ **** cadangan 1 14.535.151 149653 100% 22999 root 1341 70.380 Desember 18 , 2018 12:05:47 00:04:24 Standar Disk Pemulihan Instan MENANG - *********** 0 87,9% 0%

1339 Snapshot Selesai 150 VMware - NGNCloudADC NBCC 18 Des, 2018 11:05:46 00:00:53 AM 18:00, 2018 11:06:39 STU_DP_S3 _ **** cadangan 1 root 100% 1339 18 Desember 18, 2018 11: 05:46 AM 00:00:53 Standar Disk Pemulihan Instan MENANG - *********** 0
1327 Snapshot Done 0 VMware - *******. ********. Cloud NBCC 17 Des, 2018 12:54:42 PM 05:51:38 17 Des, 2018 6:46:20 PM STU_DP_S3 _ **** cadangan 1 root 100% 1327 17 Des, 2018 12:54:42 05:51:38 Standar Disk Pemulihan Instan MENANG - *********** 0
1328 Cadangan Selesai 0 VMware Penuh *******. ********. Cloud NBCC 17 Des, 2018 12:55:10 PM 05:29:21 17 Des, 2018 6:24:31 PM STU_DP_S3 _ **** cadangan 1 222.602.719 258932 100% 12856 root 1327 11.326 17 Des, 2018 12:55:10 PM 05:29:21 Standar Cakram Pemulihan Instan WIN - *********** 0 87.9% 0%
1136 Snapshot Done 0 VMware - *******. ********. Cloud NBCC 14 Des, 2018 4:48:22 PM 04:05:16 14 Des, 2018 8:53:38 PM STU_DP_S3 _ **** cadangan 1 root 100% 1136 14 Desember 2018 4:48:22 04:05:16 Standar Disk Pemulihan Instan MENANG - *********** 0
1140 Cadangan Selesai 0 VMware Full_Scan *******. ********. Cloud NBCC 14 Des, 2018 4:49:14 PM 03:49:58 14 Des, 2018 8:39:12 PM STU_DP_S3 _ **** cadangan 1 217.631.332 255465 100% 26438 root 1136 15.963 14 Des, 2018 4:49:14 PM 03:49:58 Standar Disk Pemulihan Instan MENANG - *********** 0 45.2% 0%

Akselerator memungkinkan Anda untuk mengurangi lalu lintas dari agen, karena hanya perubahan data yang ditransmisikan, yaitu, bahkan cadangan penuh tidak dituangkan secara keseluruhan, karena server media mengumpulkan cadangan lengkap berikutnya dari cadangan tambahan.

Server perantara memiliki repositori sendiri di mana ia menulis "cache" data dan memegang basis untuk deduplikasi.

Dalam arsitektur penuh, tampilannya seperti ini:

  1. Server master mengelola konfigurasi, pembaruan, dan banyak lagi, dan terletak di cloud.
  2. Server media (mesin * nix perantara) harus ditempatkan paling dekat dengan sistem redundan dalam hal ketersediaan jaringan. Di sini cadangan didupuplikasi dari semua mesin yang berlebihan.
  3. Ada agen di mesin redundan yang umumnya mengirim ke server media hanya apa yang tidak ada dalam penyimpanannya.

Semuanya dimulai dengan pemindaian penuh - ini adalah cadangan lengkap penuh. Pada titik ini, server media mengambil semuanya, mendupuplikasinya, dan mentransfernya ke S3. Kecepatan ke server media rendah, dari sana - lebih tinggi. Keterbatasan utama adalah kekuatan pemrosesan server.

Cadangan berikut dibuat lengkap dari sudut pandang semua sistem, tetapi dalam kenyataannya itu adalah sesuatu seperti cadangan penuh sintetis. Artinya, transfer dan perekaman aktual ke server media hanya blok data yang belum pernah dilihat dalam cadangan VM sebelumnya. Dan transfer dan perekaman ke S3 hanya blok data yang hashnya tidak ada dalam database deduplikasi server media. Jika dengan kata yang lebih sederhana - bahwa tidak ada VMs dalam cadangan apa pun sebelumnya.

Saat memulihkan, server media meminta objek terdeduplikasi yang diperlukan dari S3, rehydrate mereka dan meneruskannya ke agen CPC, mis. perlu untuk memperhitungkan volume lalu lintas selama pemulihan, yang akan sama dengan volume nyata dari data yang dipulihkan.

Begini tampilannya:



Dan di sini ada sepotong log
169 Pekerjaan (0 Antri 0 Aktif 0 Menunggu Coba Lagi 0 Ditangguhkan 0 Tidak Lengkap 169 Selesai - 1 dipilih)

Jenis Id Pekerjaan Status Negara Detail Status Kebijakan Pekerjaan Jadwal Kerja Klien Media Server Mulai Waktu Berlalu Waktu Berakhir Unit Penyimpanan Mencoba Usaha Kilobyte File Pathname% Lengkap (Perkiraan) Pekerjaan PID Pemilik Menyalin Induk ID Pekerjaan KB / Detik Mulai Aktif Aktif Telah Berlalu Robot Vault Sesi Profil Sesi ID Media untuk Mengeluarkan Gerakan Data Jenis Host Off-Master Tingkat Deduplikasi Transport Angka Optimasi Akselerator Transport atau Host Berbagi Database
- 1372 Kembalikan Selesai 0 nbpr01 NBCC 19 Des 2018 1:05:58 00:04:32 19 Des 2018 1:10:30 PM 1 14.380.577 1 100% 8548 root 1372 70.567 19 Desember 2018 1:06:00 PM 00:04:30 MENANG - *********** 90.000

Integritas data dipastikan oleh perlindungan S3 itu sendiri - ada redundansi yang baik di sana untuk melindungi terhadap kegagalan perangkat keras seperti spindle hard disk mati.

Server media membutuhkan 4 terabyte cache - ini adalah rekomendasi Veritas untuk ukuran minimum. Lebih baik lagi, tapi kami melakukan hal itu.

Ringkasan


Ketika seorang mitra melempar 20 GB ke S3 kami, kami menyimpan 60 GB, karena kami menyediakan tiga kali reservasi geo data. Sekarang lalu lintas jauh lebih sedikit, yang baik untuk saluran dan untuk pengisian daya penyimpanan.

Dalam hal ini, rute ditutup melewati "Internet besar", tetapi Anda dapat mengarahkan lalu lintas melalui VPN L2 melalui Internet, tetapi lebih baik mengatur server media ke pintu masuk penyedia.

Jika Anda tertarik untuk mempelajari fitur-fitur ini di pusat data Rusia kami atau jika Anda memiliki pertanyaan tentang bagaimana mengimplementasikannya, tanyakan dalam komentar atau email ekorotkikh@croc.ru.

Source: https://habr.com/ru/post/id461717/


All Articles