Suchen

Arktisches Archiv: Open Source Software von Github wandert in den Permafrost

| Redakteur: Ulrike Ostler

Im November des vergangenen Jahres hatte Github angekündigt, in einer 250 Meter tief im Permafrost liegenden stillgelegten Kohlemine auf Spitzbergen ein Archiv für Open Source Software zu planen. Der Stichtag, an dem alle aktiven öffentlichen Github Repositories gesichert wurden, die dann im Archiv - dem „Arctic Code Vault“ - für die nächsten Jahrhunderte gespeichert werden, war der 2.2.2020.

Firmen zum Thema

Das Open-Source-Archiv liegt eine einem Gewölbe einer ehemaligen Kohlemine auf Spitzbergen.
Das Open-Source-Archiv liegt eine einem Gewölbe einer ehemaligen Kohlemine auf Spitzbergen.
(Bild: Github)

Spitzbergen (Svalbard) ist eine von Norwegen verwaltete Inselgruppe und bezeichnet die Hauptinsel. Durch einen am 9. Februar 1920 in Paris unterzeichneten Spitzbergenvertrag (Svalbardtraktaten) erhielt Norwegen die Souveränität über den Archipel Spitzbergen inklusive aller Inseln und Felsen zwischen 74 und 81 Grad nördlicher Breite sowie zwischen 10 und 35 Grad östlicher Länge. Der Vertrag trat am 14. August 1925 in Kraft.

Und nun ist das Dauerfrostgebiet Heimat für Open Source Software, die hier auf eine lange Dauer (auf)bewahrt werden soll. Dafür arbeitet Github mit der Long Now Foundation, dem Internet-Archiv, der Software Heritage Foundation, dem Arctic World Archive, Microsoft Research, der Bodleian Library und den Stanford Libraries zusammen.

Sie sei ein „verborgener Eckpfeiler der modernen Zivilisation und das gemeinsame Erbe der gesamten Menschheit“, heißt es auf der Website des Projekts mit der Bezeichnung „Github Arctic Code Vault“. Und zum Github-Archiv-Programm heißt es: „Wir werden dieses unbezahlbare Wissen schützen, indem wir kontinuierlich mehrere Kopien in verschiedenen Datenformaten und an verschiedenen Orten speichern, einschließlich eines sehr langfristigen Archivs, das auf eine Lebensdauer von mindestens 1.000 Jahren ausgelegt ist.“

Lebendiger Code von heute werde zur historischen Kuriosität von gestern; er können aufgegeben, vergessen oder verloren gehen. "Schlimmer noch, wenn auch viel unwahrscheinlicher, im Falle einer globalen Katastrophe könnten wir in wenigen Generationen alles verlieren, was auf modernen Medien gespeichert ist", malt das Archivierungsprojekt den Teufel an die Wand.

Die Archivierung von Software über mehrere Organisationen und Speicherformen hinweg könne jedoch das Bewahren gewährleisten: Die Online-Archivare nennen dieses Prinzip „Lots Of Copies Keeps Stuff Safe“, kurz: LOCKSS. Denn viele Kopien bewahren die Dinge sicher auf. Sollte zum Beispiel Github an irgendeinem Ort nicht mehr verfügbar sein, zum Beispiel wegen eines Problems mit dem Internet-Routing, könnten die Betroffenen mit Hilfe des Internet-Archivs und der Software Heritage Foundation auf öffentlichen Code für ihre Projekte zugreifen.

Bisher sei ein beunruhigender Anteil des Weltwissens auf kurzlebigen Medien gespeichert: Festplatten, SSDs, CDs, die nur einige Jahrzehnte lang haltbar sind, und Sicherungsbänder, deren fiktive Lebensdauer von 30 Jahren streng kontrollierte Wärme und Feuchtigkeit voraussetzt. Andererseits könne manche Hardware, insbesondere ältere und/oder solche mit Masken-ROM,durchaus viel länger leben und es gebe eine Reihe von möglichen Zukunftsszenarien, in denen sie ein Rolle spielen können, doch ihre Software wäre vermutlich durch Bit-Fäule verloren gegangen.

Deshalb werde das GitHub-Archivprogramm auf Medien umfassen, die die Informationen länger aufbewahren können, um dem Risiko des Datenverlusts zu begegnen.

Wie die Zukunft den Code nutzen könnte

Zukünftige Historiker sollen sich per Github-Archiv über Open-Source-Projekte und Metadaten informieren können. Schließlich sei es möglich, dass sie das Zeitalter, in dem Open Source überall zu finden ist , das Prinzip von Communities und das Moore'schen Gesetze als historisch bedeutsam betrachten. In der Zusammenarbeit mit den Stanford Libraries entstehen bereits kuratierte Repositoris, die etwa in einen kulturellen gesetzt werden - für historische und soziale Forschungsgebiete.

Beispiele für Wissen über Techniken und Technologien, die verloren gegangen sind, von denen aber die Welt profitieren könnte oder gekonnt hätte, gibt es zahlreiche. Das Github-Archiv-Projekt zählt etwa die Jagd nach eingemotteten „Saturn-V“-Bauplänen nach der „Challenger“-Katastrophe dazu, aber auch den römischen Beton und Difluorodiphenyltrichlorethan (DFDT), eine chemische Verbindung, deren Zusammensetzung die des Insektizids DDT ist. Allerdings hatten deutsche Wissenschaftler während des zweiten Welkriegs zwei der Chloratome von DDT durch zwei Fluoratome ersetzt, vermutlich um Lizenzgebühren zu vermeiden. Mit DFDT lässt sich höchstwirksam Malaria bekämpfen, mit weniger Schadstoffen als heutige Medikamente. Erst im vergangenen Jahr wurde man wieder darauf aufmerksam.

Das soll mit den Github-Schätzen nicht passieren: dotnet/core, torvalds/linux, python/cpython, bitcoin/bitcoin, rails/rails, docker/machine, openssl/openssl, nodejs/node, Homebrew/brew, php/php-src, twbs/bootstrap, microsoft/TypeScript, apache/hadoop, v8/v8, Alamofire/Alamofire, gatsbyjs/gatsby, fastai/fastai, jimweirich/builder, zeit/next.js, WordPress/WordPress, rust-lang/rust, golang/go, angular/angular, jquery/jquery, ruby/ruby, facebook/react, CocoaPods/CocoaPods, jupyter/notebook, zeromq/libzmq, postgres/postgres, microsoft/MS-DOS, Netflix/chaosmonkey, robbyrussell/oh-my-zsh, xamarin/xunit, grafana/grafana, graphql/graphql-js, github/gh-ost, rspec/rspec, libgit2/libgit2, ... heißen etwa die Projekte für 2020.

Dieser Beitrag stammt von unserem Partnerportal Bigdata-Insider.de.

(ID:46351059)