Ehemalige Kohlengrube, in der sich das Arctic World Archive befindet. Foto : Guy Martin / Bloomberg BusinessweekFreie Software ist der Eckpfeiler der modernen Zivilisation und das gemeinsame Erbe der gesamten Menschheit. Die Mission des
GitHub Archive-Programms ist es, diesen Code für zukünftige Generationen aufzubewahren, damit sich die Geschichte der Alexandria-Bibliothek nie wiederholt.
Zu diesem Zweck verwaltet GitHub viele Backups auf verschiedenen Medien, einschließlich des Langzeitspeichers von
Arctic Code Vault auf Svalbard. Es befindet sich in einer ehemaligen Kohlengrube in einer Tiefe von 250 Metern im Permafrost und ist für eine Haltbarkeit von mindestens 1000 Jahren ausgelegt.
Ein Schnappschuss des menschlichen Codes wird am 2. Februar 2020 aufgenommen .
Das Langzeitprojekt zur Datenspeicherung wurde in Zusammenarbeit mit der Long Now Foundation, dem Internet Archive, der Software Heritage Foundation, dem Arctic World Archive und anderen Partnern gestartet.
LOCKSS-Projekt
Der heutige lebenswichtige Code kann im Laufe der Zeit vergessen oder verloren gehen. Das Schlimmste ist, wenn wir im Falle einer globalen Katastrophe alle Informationen verlieren, die auf den „kurzlebigen“ Medien gespeichert waren: HDD, SSD, CD und DVD, die für mehrere Jahrzehnte ausgelegt sind, auf Bändern mit einer bedingten Lebensdauer von 30 Jahren, die eine strenge Kontrolle von Temperatur und Luftfeuchtigkeit erfordern .
Die Lösung des Problems besteht in der Vervielfältigung von Sicherungen, dh in der Archivierung von Software durch mehrere Organisationen und in unterschiedlichen Formen. Dieses Projekt mit dem Namen
LOCKSS startete vor
fast 20 Jahren . Im Mai 2019 wurde das Programm
LOCKSS 2.0-alpha eingeführt - die erste Prototypensoftware für die verteilte Datenspeicherung seit langem mit Unterstützung vieler Teilnehmer und externer Speicher.
Die Entwickler des Systems gehen davon aus, dass Hardware viel langlebiger sein kann als kurzlebige Medien: "Es gibt daher eine Reihe möglicher zukünftiger Optionen, in denen moderne Arbeitscomputer existieren, aber ihre Software geht weitgehend verloren."
GitHub erinnert an viele verlorene Technologien, die nützlich sein könnten:
römischer Beton (sein Rezept wurde erst 2014 wiederentdeckt), das
Malariamedikament DFDT , verlor
Zeichnungen der Saturn-5-Rakete . Man kann sich leicht eine Zukunft vorstellen, in der heutige Software als bizarr betrachtet und lange Zeit als unnötig vergessen wird, bis ein unerwarteter Bedarf besteht: "Wie jedes Backup ist auch das GitHub-Archivprogramm für die unvorhergesehene Zukunft ausgelegt", heißt es auf der Website des GitHub-Programms Archiv
Github-Archiv
GitHub Archive bietet drei Sicherungsstufen:
- Heiß : fast in Echtzeit
- Warm : aktualisiert von Monat zu Jahr
- Kalt : alle 5+ Jahre aktualisiert
Nach jeder Aktion von GitHub-Benutzern werden alle Git-Daten in mehrere Rechenzentren auf der ganzen Welt repliziert. Git Backups, Issue, Pool Requests und alle Benutzerdaten auf GitHub werden an mehreren Stellen gespeichert. Diese Informationen sind in Echtzeit über die GitHub-API verfügbar.
Darüber hinaus wurde die rekursive Indizierung vom GHTorrent-Crawler organisiert, der täglich oder monatlich Archive hochlädt. Über GH Archive können Snapshots aus dem Archiv von BigQuery-Abfragen abgerufen werden. Weitere Kopien des Codes befinden sich in der bekannten "Time Machine" für das Internetarchiv, in der Kopien an mehreren Stellen gespeichert sind. Schließlich wird die Software Heritage Foundation GitHub regelmäßig scannen und seine öffentlichen Repositorys zu seinem Archiv hinzufügen, für das es eine öffentliche API gibt.
Arctic GitHub-Speicher
Am 2. Februar 2020 erstellt GitHub eine Kopie aller aktiven öffentlichen Repositorys und legt sie im Arctic GitHub-Repository ab.
Die Daten werden auf 3.500-Fuß-Filmspulen gespeichert, die von der norwegischen Firma Piql bereitgestellt werden, die auf die Langzeitdatenspeicherung spezialisiert ist. Nach ISO-Messungen hat diese Folie mit Silberhalogenid in Polyester eine Lebensdauer von 500 Jahren. Alterungssimulationstests haben gezeigt, dass Piql-Filme mindestens doppelt so lange Informationen speichern.
Außerdem arbeitet GitHub Archive mit Forschern des Microsoft Silica-Projekts zusammen, um alle öffentlichen Speicher mit einem Femtosekundenlaser auf Quarzglasplatten aufzuzeichnen. Dieses Medium wird die Datensicherheit für mehr als 10.000 Jahre gewährleisten.
Das GitHub Arctic Code Repository basiert auf dem Arctic World Archive (AWA) in einer Tiefe von 250 Metern im Permafrost. Das Archiv befindet sich in einem ehemaligen Kohlenbergwerk auf dem Spitzbergen-Archipel, nicht weit vom Nordpol entfernt. Die globale Erwärmung wird nur wenige Meter Permafrost betreffen und die Mine in naher Zukunft (mehrere tausend Jahre) nicht gefährden.
Spitzbergen ist
völkerrechtlich als entmilitarisierte Zone geregelt. Laut GitHub ist dies eine der abgelegensten und geopolitisch stabilsten menschlichen Siedlungen auf der Erde. In der Nähe befindet sich das berühmte World Seed Storage, die größte Hoffnung der Menschheit im Falle einer Apokalypse.
Svalbard World Seed StoreAWA ist eine gemeinsame Initiative des norwegischen staatlichen Bergbauunternehmens Norske Spitsbergen Kulkompani (SNSK) und des Anbieters von digitaler Konservierung Piql AS. Dort sind bereits historische und kulturelle Daten aus Italien, Brasilien, Norwegen, dem Vatikan und anderen Ländern hinterlegt.
Foto : Guy Martin / Bloomberg BusinessweekGitHub-Spulen werden in einem Behälter mit Stahlwänden in einer versiegelten Kammer aufbewahrt. Alle aktiven GitHub-Repositorys und ein erheblicher Teil der inaktiven Repositorys (gemessen an den Sternen, Abhängigkeiten usw.), alle Binärdateien bis zu 100 KB, fallen in den Snapshot 02.02.2020. Jedes Repository in einer separaten TAR-Datei. Alles sollte auf 200 Spulen mit 120 GB passen.
Zusammen mit dem Archiv werden sie einen lesbaren Katalog und technische Handbücher zur QR-Dekodierung, zu Dateiformaten, Zeichenkodierungen und anderen wichtigen Metadaten bereitstellen, damit Nachkommen die Daten wieder in Quellcode konvertieren können.
Das Archiv enthält auch den Tech Tech-Leitfaden für den Fall, dass zukünftige Leser keinen funktionierenden Computer haben und die Technologie von Grund auf wiederherstellen müssen.