Klasifikasi apa pun adalah arbitrer. Alam tidak mengklasifikasikan. Kami mengklasifikasikan, karena lebih nyaman bagi kami. Dan kami mengklasifikasikan berdasarkan data, yang juga kami ambil secara sewenang-wenang.
—Jan Bruler
Terlepas dari metode penyimpanan fisik, penyimpanan logis data dapat dibagi menjadi 2 cara mengakses data ini: blok dan file. Divisi ini baru-baru ini sangat buram, karena murni blok, serta murni file, penyimpanan logis tidak ada. Namun, untuk kesederhanaan, kami menganggap itu memang benar.
Blok penyimpanan data menyiratkan bahwa ada perangkat fisik di mana data direkam dalam beberapa bagian tetap, blok. Akses ke blok menuju ke alamat tertentu, setiap blok memiliki alamatnya sendiri di dalam perangkat.
Pencadangan biasanya dilakukan dengan menyalin blok data. Untuk memastikan integritas data pada saat penyalinan, pencatatan blok baru, serta modifikasi yang sudah ada, ditangguhkan. Jika kita mengambil analogi dari dunia biasa, lemari terdekat adalah dengan sel bernomor yang sama.

Penyimpanan file data dengan prinsip perangkat logis dekat dengan penyimpanan blok dan sering diatur di atas. Perbedaan penting adalah keberadaan hierarki penyimpanan dan nama yang dapat dibaca manusia. Abstraksi disorot dalam bentuk file - area data bernama, serta direktori - file khusus di mana deskripsi dan akses ke file lain disimpan. File dapat diberikan dengan metadata tambahan: waktu pembuatan, bendera akses, dll. Mereka biasanya membuat cadangan dengan cara ini: mereka mencari file yang diubah, kemudian menyalinnya ke penyimpanan file lain dengan struktur yang sama. Integritas data biasanya diimplementasikan dengan tidak adanya file yang sedang ditulis. Metadata file didukung dengan cara yang sama. Analogi terdekat adalah perpustakaan, yang memiliki bagian-bagian dengan buku yang berbeda, serta katalog dengan nama buku yang dapat dibaca manusia.

Baru-baru ini, opsi lain kadang-kadang dijelaskan, dengan mana, pada prinsipnya, penyimpanan file data dimulai, dan yang memiliki fitur kuno yang sama: penyimpanan data objek.
Ini berbeda dari penyimpanan file karena tidak memiliki lebih dari satu sarang (tata letak datar), dan nama file, meskipun dapat dibaca oleh manusia, tetap lebih cocok untuk diproses oleh mesin. Saat mencadangkan, penyimpanan objek paling sering diperlakukan seperti penyimpanan file, tetapi kadang-kadang ada opsi lain.
- Ada dua jenis administrator sistem, mereka yang tidak membuat cadangan, dan mereka yang sudah melakukannya.
- Sebenarnya, ada tiga jenis: ada juga yang memverifikasi bahwa cadangan dapat dipulihkan.
—Tidak diketahui
Penting juga dipahami bahwa proses pencadangan data dilakukan oleh program, sehingga memiliki semua kelemahan yang sama dengan program lain. Untuk menghapus (tidak mengecualikan!) Ketergantungan pada faktor manusia, serta fitur - yang secara individual tidak sangat mempengaruhi, tetapi bersama-sama dapat memberikan efek nyata - menerapkan apa yang disebut aturan 3-2-1. Ada banyak opsi untuk mendekripsi, tetapi saya lebih suka interpretasi berikut: Anda perlu menyimpan 3 set data yang sama, 2 set harus disimpan dalam format yang berbeda, dan 1 set harus disimpan dalam penyimpanan yang jauh secara geografis.
Format penyimpanan harus dipahami sebagai berikut:
- Jika ada ketergantungan pada metode penyimpanan fisik, kami mengubah metode fisik.
- Jika ada ketergantungan pada metode penyimpanan logis, kami mengubah metode logis.
Untuk mencapai efek maksimum aturan 3-2-1, disarankan untuk mengubah format penyimpanan dengan dua cara.
Dari sudut pandang kesiapan cadangan untuk tujuan yang dimaksudkan - pemulihan operabilitas, ada cadangan "panas" dan "dingin". Panas dari dingin berbeda hanya dalam satu hal: mereka segera siap untuk bekerja, sementara dingin untuk pemulihan memerlukan beberapa tindakan tambahan: dekripsi, ekstraksi dari arsip, dll.
Jangan bingung salinan panas dan dingin dengan salinan online dan offline, yang menyiratkan isolasi fisik data, dan pada kenyataannya, adalah tanda lain dari klasifikasi metode cadangan. Jadi salinan offline - tidak terhubung langsung ke sistem di mana perlu dipulihkan - bisa panas atau dingin (dalam hal kesiapan untuk pemulihan). Salinan online mungkin tersedia langsung di tempat yang perlu dipulihkan, dan paling sering panas, tetapi ada juga yang dingin.
Selain itu, jangan lupa bahwa proses membuat cadangan biasanya tidak berakhir dengan membuat cadangan tunggal, dan mungkin ada cukup banyak salinan. Oleh karena itu, perlu untuk membedakan antara cadangan lengkap, mis. salinan yang dapat dipulihkan secara terpisah dari cadangan lain, serta salinan diferensial (inkremental, diferensial, decremental, dll.) - yang tidak dapat dipulihkan sendiri dan memerlukan pemulihan awal satu atau lebih cadangan lain.
Cadangan inkremental diferensial - upaya untuk menghemat jumlah ruang untuk menyimpan cadangan. Dengan demikian, hanya data yang dimodifikasi dari cadangan sebelumnya yang ditulis ke cadangan.
Perbedaan decrementals dibuat untuk tujuan yang sama, tetapi dengan cara yang sedikit berbeda: cadangan penuh dibuat, tetapi hanya perbedaan antara salinan baru dan yang sebelumnya benar-benar disimpan.
Secara terpisah, ada baiknya mempertimbangkan proses pencadangan di atas penyimpanan, yang mendukung tidak adanya penyimpanan duplikat. Jadi, jika Anda menulis cadangan penuh di atasnya, pada kenyataannya hanya perbedaan antara cadangan yang akan dicatat, namun, proses pengembalian cadangan akan sama dengan memulihkan dari salinan lengkap dan sepenuhnya transparan.
Quis custodiet ipsos custodes?
(Siapa yang akan menjaga sendiri penjaga? - lat.)
Sangat tidak menyenangkan ketika tidak ada cadangan, tetapi jauh lebih buruk jika cadangan tampaknya dibuat, tetapi selama pemulihan ternyata tidak dapat dipulihkan, karena:
- Integritas sumber data telah dilanggar.
- Penyimpanan cadangan rusak.
- Pemulihan bekerja sangat lambat, Anda tidak dapat menggunakan data yang sebagian dipulihkan.
Proses pencadangan yang dibangun dengan benar harus memperhitungkan komentar semacam itu, terutama yang pertama.
Integritas sumber data dapat dijamin dalam beberapa cara. Yang paling umum digunakan adalah: a) membuat snapshot sistem file pada level blok, b) membekukan status sistem file, c) perangkat blok khusus dengan penyimpanan versi, d) rekaman berurutan file atau blok. Checksum juga digunakan untuk memastikan verifikasi data selama pemulihan.
Kerusakan pada penyimpanan juga dapat dideteksi menggunakan checksum. Metode tambahan adalah penggunaan perangkat khusus atau sistem file di mana tidak mungkin untuk memodifikasi data yang sudah direkam, tetapi Anda dapat menambahkan yang baru.
Untuk mempercepat pemulihan, pemulihan data digunakan dengan beberapa proses pemulihan - asalkan tidak ada "hambatan" dalam bentuk jaringan yang lambat atau sistem disk yang lambat. Untuk menghindari situasi dengan data yang dipulihkan sebagian, dimungkinkan untuk memecah proses pencadangan menjadi subtugas yang relatif kecil, yang masing-masing dilakukan secara terpisah. Dengan demikian, menjadi mungkin untuk secara konsisten mengembalikan kinerja dengan prediksi waktu pemulihan. Masalah ini paling sering terletak pada bidang organisasi (SLA), jadi kami tidak akan membahasnya secara rinci.
Tahu banyak tentang rempah-rempah bukan orang yang menambahkannya ke setiap hidangan, tetapi orang yang tidak pernah menambahkan sesuatu yang berlebihan untuk itu.
—B. Sinyavsky
Praktik mengenai perangkat lunak yang digunakan oleh administrator sistem dapat bervariasi, tetapi prinsip-prinsip umum masih sama, satu atau lain cara, khususnya:
- Solusi siap pakai sangat dianjurkan.
- Program harus bekerja dengan mudah, mis. Seharusnya tidak ada fitur atau kemacetan yang tidak terdokumentasi.
- Menyiapkan setiap program harus cukup sederhana sehingga Anda tidak perlu membaca manual atau lembar contekan setiap saat.
- Solusinya harus universal, jika memungkinkan. server dalam spesifikasi perangkat kerasnya dapat sangat bervariasi.
Program umum berikut tersedia untuk menghapus cadangan dari perangkat blok:
- dd, akrab dengan veteran administrasi sistem, program serupa juga berlaku di sini (dd_rescue yang sama, misalnya).
- Utilitas (utilitas) dibangun ke dalam beberapa sistem file yang membuat dump dari sistem file.
- Utilitas omnivora; mis. partclone.
- Keputusan sendiri, seringkali hak milik; mis. NortonGhost dan yang lebih baru.
Untuk sistem file, tugas cadangan sebagian diselesaikan menggunakan metode yang berlaku untuk memblokir perangkat, namun, masalahnya dapat diselesaikan lebih efisien, menggunakan, misalnya:
- Rsync, program dan protokol universal untuk menyinkronkan keadaan sistem file.
- Alat pengarsipan bawaan (ZFS).
- Alat pengarsipan pihak ketiga; perwakilan yang paling populer adalah tar. Ada yang lain, misalnya, mengganti tar dengan fokus pada sistem modern.
Secara terpisah, ada baiknya menyebutkan perangkat lunak konsistensi data saat membuat cadangan. Opsi yang paling umum digunakan adalah:
- Memasang sistem file dalam mode hanya baca (ReadOnly), atau membekukan sistem file (membekukan) - metode ini terbatas.
- Membuat snapshot dari keadaan sistem file atau memblokir perangkat (LVM, ZFS).
- Penggunaan alat pihak ketiga untuk mengatur gips, bahkan dalam kasus di mana paragraf sebelumnya tidak dapat diberikan karena alasan apa pun (program seperti hotcopy).
- Teknik copy-on-change (CopyOnWrite), bagaimanapun, itu paling sering dikaitkan dengan FS yang digunakan (BTRFS, ZFS).