Dienstag, 27. August 2019

Das famose Internet Archive :-) und die Wayback Machine

Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, welches 1996 ins Leben gerufen wurde. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht und stellt kostenfrei eine gigantische Menge von Filmen, Tonaufnahmen, Momentaufnahmen von Webseiten, Usenetbeiträgen, Büchern und Software zur Verfügung. Eine Sicherungskopie der Daten von San Francisco befindet sich in der Bibliothek von Alexandria.

Zum Archiv gehört auch die Wayback Machine („Internet-Zeitmaschine“, siehe den Beitrag weiter unten), mit der man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Der Gesamtumfang beträgt derzeit etwa 85 Milliarden Seiten.
Problematisch an der Wayback Machine ist, dass auch Inhalte erhalten bleiben, die die Autorinnen evtl. nicht mehr vertreten. Auch rechtswidrige Inhalte, etwa üble Nachreden (oder bspw. Lehrer-Bashing durch Schülerinnen), werden über Jahre der Öffentlichkeit zugänglich gemacht.

In dem so genannten Million Book Project werden durch das Internet Archive Bücher, die durch das Ablaufen des Copyrights oder aus anderen Gründen gemeinfrei geworden sind, digitalisiert und in den Dateiformaten DjVu, TIFF und PDF zum Download zur Verfügung gestellt.

Das Internet Archive darf auch Computer-Software oder -Spiele mit der Absicht der Erhaltung speichern, wenn die Originalhardware, -formate oder -technologie veraltet sind.

Das Archiv hat eine geschätzte Größe von drei Petabyte und wächst um ca. 20 Terabyte pro Monat. Das Archiv ist vom Bundesstaat Kalifornien seit Anfang Mai 2007 offiziell als Bibliothek anerkannt. Für Lehrende und Studierende ist das Internet-Archive *die* Quelle für gemeinfreie (kein Copyright) Filme, Tonaufnahmen, Texte etc.

Diese Materialien sind ein ausgezeichnetes Ausgangsmaterial für das Erstellen von Lehrmaterialien, für die Illustration von Publikationen, für Referate und Hausarbeiten etc.

URL: http://www.archive.org


Die Wayback Machine

Das Internet gilt allgemein als das schnelllebigste Medium der Welt. Das Zitieren von Einzelseiten in Publikationen macht kaum Sinn, da Informationen auf Websites jederzeit verschoben, verändert oder gelöscht werden können. Für Abhilfe könnte jedoch die Wayback Machine des gemeinnützigen Projekt s archive.org sorgen.
Zu den wichtigsten Werkzeugen, um die Historie einer Website festzuhalten, zählt inzwischen deren "Wayback-Machine". Dank eines Archives von über 85 Milliarden Webseiten können Änderungen rund um eine Domain kostenlos verfolgt werden. Nach Eingabe der Domain erhält man einen stichpunktartigen Index mit historischen Momentaufnahmen von Webseiten.

Wer es etwas kleiner möchte, dem sei die "Google Cache"-Funktion der beliebten Suchmaschine empfohlen. Nach Eingabe des Suchbegriffs erscheint nicht nur eine Trefferliste, sondern zu jedem Link auch ein Verweis auf "Im Cache". Dort erhalten die AnwenderInnen einen Blick in die Vergangenheit, wie die gewünschte Seite aussah, als sie von Google indexiert wurde. Auch so lassen sich gelöschte Internetauftritte komfortabel rekonstruieren.


URL: https://archive.org/web/

 

Quellen: archive.org, arb-forum.com, wsj.com


Keine Kommentare: