GitHub telah membuat repositori berusia ribuan tahun yang akan menyimpan repositori Open Source untuk anak cucu


Bekas tambang batu bara yang menjadi tuan rumah Arsip Dunia Arktik. Foto : Guy Martin / Bloomberg Businessweek

Perangkat lunak bebas adalah landasan peradaban modern dan warisan bersama seluruh umat manusia. Misi dari program Arsip GitHub adalah untuk melestarikan kode ini untuk generasi mendatang sehingga sejarah perpustakaan Alexandria tidak pernah terulang.

Untuk melakukan ini, GitHub akan mempertahankan banyak cadangan di berbagai media, termasuk penyimpanan Vault Kode Arktik jangka panjang di Svalbard. Itu terletak di bekas tambang batu bara di kedalaman 250 meter di lapisan es dan dirancang untuk umur simpan minimal 1.000 tahun.

Cuplikan kode manusia akan diambil pada 2 Februari 2020 .

Proyek penyimpanan data jangka panjang diluncurkan bersama dengan Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive, dan mitra lainnya.

Proyek LOCKSS


Kode vital hari ini mungkin dilupakan atau hilang seiring waktu. Yang terburuk adalah jika dalam peristiwa bencana global kita kehilangan semua informasi yang disimpan di media "sesaat": HDD, SSD, CD dan DVD, yang dirancang selama beberapa dekade, pada kaset dengan umur 30 tahun bersyarat membutuhkan kontrol suhu dan kelembaban yang ketat .

Solusi untuk masalah ini adalah duplikasi cadangan, yaitu, pengarsipan perangkat lunak oleh beberapa organisasi dan dalam berbagai bentuk. Proyek ini, yang disebut LOCKSS, dimulai selama hampir 20 tahun . Pada Mei 2019, program LOCKSS 2.0-alpha diperkenalkan - perangkat lunak prototipe pertama untuk penyimpanan data terdistribusi untuk waktu yang lama dengan dukungan banyak peserta dan penyimpanan eksternal.

Pengembang sistem melanjutkan dari fakta bahwa perangkat keras bisa jauh lebih tahan lama daripada media fana: karena itu, "ada sejumlah opsi di masa depan yang memungkinkan di mana komputer yang bekerja modern ada, tetapi perangkat lunak mereka sebagian besar hilang."

GitHub mengingat banyak teknologi yang hilang yang dapat berguna: beton Romawi (resepnya ditemukan kembali hanya pada tahun 2014), obat anti-malaria DFDT , kehilangan gambar roket Saturn-5 . Sangat mudah untuk membayangkan masa depan di mana perangkat lunak saat ini akan dianggap aneh dan sudah lama dilupakan tanpa perlu sampai ada kebutuhan tak terduga untuk itu: "Seperti cadangan apa pun, program arsip GitHub juga dirancang untuk masa depan yang tidak terduga," kata situs web program GitHub Arsipkan

Arsip Github


Arsip GitHub menyediakan tiga tingkat cadangan:

  • Hot : hampir real time
  • Hangat : diperbarui dari bulan ke tahun
  • Dingin : diperbarui setiap 5+ tahun

Setelah tindakan apa pun oleh pengguna GitHub, semua data Git direplikasi ke beberapa pusat data di seluruh dunia. Cadangan Git, masalah, permintaan kumpulan dan semua data pengguna di GitHub disimpan di beberapa tempat. Informasi ini tersedia secara real time melalui API GitHub.

Selain itu, pengindeksan berulang dilakukan oleh perayap GHTorrent, yang akan mengunggah arsip setiap hari atau setiap bulan. Melalui GH Archive, foto-foto dari arsip dapat diambil oleh permintaan BigQuery. Salinan lain dari kode tersebut terletak di "Mesin Waktu" yang terkenal untuk arsip Internet, yang menyimpan salinan di beberapa tempat. Akhirnya, Software Heritage Foundation akan secara teratur memindai GitHub dan menambahkan repositori publiknya ke arsipnya, yang di dalamnya terdapat API publik.

Penyimpanan GitHub Arktik


Pada 2 Februari 2020, GitHub akan membuat salinan dari semua repositori publik yang aktif - dan menempatkannya di repositori Arktik GitHub.

Data akan disimpan pada gulungan film setinggi 3.500 kaki yang disediakan oleh perusahaan Norwegia Piql, yang berspesialisasi dalam penyimpanan data jangka panjang. Menurut pengukuran ISO, film ini dengan perak halida dalam poliester memiliki masa hidup 500 tahun. Simulasi uji penuaan menunjukkan bahwa film Piql menyimpan informasi setidaknya dua kali lebih lama.

Selain itu, GitHub Archive bekerja dengan para peneliti di proyek Microsoft Silica untuk merekam semua repositori publik di piring kaca kuarsa menggunakan laser femtosecond. Media ini akan memastikan keamanan data selama lebih dari 10.000 tahun.

Gudang kode Arktik GitHub dibuat berdasarkan Arsip Dunia Arktik (AWA) pada kedalaman 250 meter di lapisan es. Arsip tersebut terletak di bekas tambang batubara di kepulauan Spitsbergen, yang tidak jauh dari Kutub Utara. Pemanasan global hanya akan memengaruhi permafrost beberapa meter dan tidak mengancam tambang dalam waktu dekat (beberapa ribu tahun).

Svalbard diatur oleh perjanjian internasional sebagai zona demiliterisasi. Ini adalah salah satu pemukiman manusia yang paling terpencil dan secara geopolitik stabil di Bumi, kata GitHub. Ada di dekat World Seed Storage yang terkenal, harapan utama umat manusia dalam peristiwa kiamat.


Toko Benih Dunia Svalbard

AWA adalah inisiatif bersama antara perusahaan pertambangan milik negara Norwegia Norske Spitsbergen Kulkompani (SNSK) dan penyedia pelestarian digital Piql AS. Data historis dan budaya dari Italia, Brasil, Norwegia, Vatikan, dan negara-negara lain sudah tersimpan di sana.


Foto : Guy Martin / Bloomberg Businessweek

Gulungan GitHub akan disimpan dalam wadah dengan dinding baja di dalam ruang tertutup. Semua repositori GitHub aktif dan bagian signifikan dari yang tidak aktif (dilihat dari bintang-bintang, dependensi, dll.), Semua file biner hingga 100 KB, akan jatuh ke dalam snapshot 02.02.2020. Setiap repositori di file tar terpisah. Semuanya harus sesuai dengan 200 gulungan 120 GB.

Bersama dengan arsip, mereka akan menempatkan katalog yang dapat dibaca manusia dan manual teknis pada decoding QR, format file, pengkodean karakter, dan metadata penting lainnya sehingga keturunan dapat mengubah data kembali ke kode sumber.

Arsip ini juga akan mencakup panduan umum Tech Tech jika pembaca di masa mendatang tidak memiliki komputer yang berfungsi dan harus memulihkan teknologi dari awal.

Source: https://habr.com/ru/post/id475808/


All Articles