Wie Websites lernen
Das letzte Lebenszeichen: 13 Jahre her.
Das aktuelle Design: 19 Jahre alt.
Diese Site war mal mein ganzer Stolz.
Zeit, ihr neues Leben einzuhauchen …
Schritt 1: Entropie zurücksetzen!
Tote Links heilen
„Das Netz vergisst nicht“ ist ein Irrtum. Jeden Tag wird im Web gelöscht, verschoben, vergessen – unsere Links führen ins Leere. Zum Glück gibt es ein Schattenreich, in dem verlorene URLs weiterleben.
Als hätte jemand Seiten aus einem Buch gerissen, in dem man gern noch lesen würde – eine Website mit kaputten Links wirkt ungepflegt, veraltet.
Also habe ich die Site wieder etwas auf Zack gebracht:
- 284 gebrochene Links durch Archiv-Links
repariert – mit Icon und Tooltip-Datum zur Wayback Machine
- 31 echte Linkleichen durch gestrichelte Unterlinie gekennzeichnet
- meine Podcastepisoden wiederhergestellt – MP3s selbstgehostet & neuen Feed erstellt
- meinen Static Site Generator von Rails 1.1.4 (2006) auf Rails 8 migriert
Wayback Machine & Internet Archive
Das Internet Archive ist die wohl bekannteste Plattform, um Vergangenes zu bewahren. Gegründet 1996 mit der Weitsicht, dass das Web ein dynamisches, wachsendes Artefakt von kulturellem Wert ist, archiviert die Wayback Machine heute das halbe Internet.
Zeitanker: Warum restaurierte Links großartig sind
Ein kleiner Trick erlaubt, auf genau den Moment zu verlinken, den ich damals gesehen habe.
„Ein Memento.“
Jeder restaurierte Link bewahrt Kontext, Erinnerung, Integrität.
Ich nenne sie deshalb Zeitanker: <a>(t)
– ein Link mit eingebauter Zeitmarke.
Aber das Beste?
Archiv-Replay-Modus
Die Wayback Machine ist mehr als eine Zeitkapsel. Folgt man dort einem Link, stellt sie den zeitlichen Kontext wieder her. Man surft durch die Vergangenheit – exakt im Zeitkorridor, in dem man war. Willkommen in deinem eigenen Web‑Zeitreise‑Modus.
Einstieg in die Zeitmaschine
Die Kurzformel für den Sprung ins Archiv: URL anhängen – fertig:
https://web.archive.org/web/*/URL
Das Sternchen ist ein Joker für den Zeitpunkt und öffnet eine Kalenderansicht aller gespeicherten Snapshots.
Pro-Tipps
Zeige alle im Archiv bekannten Dateien als große Tabelle:
https://web.archive.org/web/*/http://frankwestphal.de/*
Grenze die Anzeige auf bestimmte Pfade oder URL-Muster ein:
https://web.archive.org/web/*/frankwestphal.de/ftp/*
Springe gezielt zu einem Monat oder Jahr deiner Wahl:
https://web.archive.org/web/201005*/https://rivva.de
Das Sternchen ist mächtiger als man denkt.
Mein Restaurationstrick: <a>(t)
mit t = a.t
Machst du statt des Sternchens eine Zeitangabe, landest du genau dort:
https://web.archive.org/web/YYYYMMDDhhmmss/URL
Wenn wir als Zeitpunkt t
nun das Veröffentlichungsdatum a.t
unseres Artikels a
einsetzen – also dort, wo der kaputte Link steht: <a>(t)
–, sucht die Wayback Machine automatisch den Snapshot, der diesem Zeitpunkt am nächsten liegt.
Für die Restaurierung historischer Inhalte ein Gamechanger.
Websitearchäologie
Im Zeitreisezyklus von Connie Willis können Historiker nur zu bestimmten Koordinaten in Raum und Zeit reisen. William Gibson nannte sie „Nodal points“ – jene Momente, an denen „etwas kippt“, an denen sich die Zukunft verzweigt.
Für Ausflüge ins gestrige Web brauchen wir solche Startpunkte. Sie sind entscheidend für das richtige Feeling, um sich – ganz im Flow – durch vergangene Weblandschaften treiben zu lassen.
Der Wert kaputter Links
Aus diesem Grund sind veraltete Links um Längen besser als Löschen oder Abschalten. Tote Links sind belegende Artefakte, kein Mangel – richtig gekennzeichnet, zeigen sie Quellenlage. So lassen sich Inhalte oft noch rekonstruieren – über die URL, über Archive, über Kontext.
Die Library of Congress schreibt: „if anything, the value of a broken link seems to be increasing“.
Es lohnt sich also, die Infrastruktur so zu gestalten, dass nicht nur die Inhalte gepflegt werden können – sondern ebenso ihre Beziehungen. Denn Links sind mehr als Verbindungen. Sie drücken Beziehungen aus. Und Beziehungen verdienen Pflege.
Meine Restaurationsstrategie
Preprocessing: Tote Links finden
- alle Artikel nach externen Links scannen
- jeden Link prüfen auf Erreichbarkeit (200 OK) und Jaccard-Ähnlichkeit (gleicher Inhalt wie damals oder Domain verkauft?)
- für alle kaputten Links die Wayback Availability API befragen
- Ergebnisse in einer YAML-Datei zusammentragen
Die YAML-Datei erlaubt dann, kaputte URLs auf reparierte URLs abzubilden. So kann der zuvor beschriebene Zeitanker (Standardverhalten: t = a.t) bei Bedarf überschrieben werden.
Ziel war: Texte erhalten, Links beleben. Mit klarer Trennung von Inhalt und Logik. Das HTML bleibt unabhängig vom YAML. URLs werden nicht hart ersetzt, sondern durch eine transparente Logik behandelt. So bleiben die Original-URLs im Quelltext erhalten – lesbar und nachvollziehbar.
Postprocessing: Tote Links live umschreiben
- im HTML erneut alle Links extrahieren – diesmal zur Laufzeit
- externe Links durch das YAML-Mapping filtern
- reparierte Links transparent umleiten (Decorator Pattern)
- archivierte und verwaiste Links visuell kennzeichnen
Ziel war: Inhalte bewahren, Struktur respektieren. Alle Änderungen sind nicht-destruktiv. Der Originaltext bleibt unangetastet – die Reparatur erfolgt rein visuell, als zarte Schicht darüber. Wie eine Goldnaht im Kintsugi-Stil: sichtbar, ehrlich, reversibel.
Digitale Patina
Was mir wichtig war: Nicht löschen, sondern verwandeln.
Die Hypertext-Ästhetik sollte erhalten bleiben – Links sind Teil des Leseflusses, sie schaffen Bedeutung und Orientierung. Wenn man kaputte Links einfach entfernt, geht oft mehr verloren als nur die Verknüpfung: Der Text verliert insgesamt.
Die Lösung: Alte Inhalte mit Veröffentlichungsdatum ins Internet Archive spiegeln. Das kleine IA-Icon wirkt dabei wie eine digitale Patina: Ein sichtbares Zeichen dafür, dass es sich um eine archivierte Kopie handelt, nicht die voll funktionsfähige Originalseite.
Xanadu (1960)
Ted Nelsons Xanadu-Projekt war seiner Zeit weit voraus. Es dachte Hypertext radikal anders: Links waren nicht bloße Verweise, sondern aktive Beziehungen zwischen lebendigen Inhalten.
- Transklusion statt Kopie:
Inhalte wurden nicht dupliziert, sondern als Segmente virtuell eingebunden – mit Herkunft, Kontext und Versionsgeschichte. - Unbrechbare, bidirektionale Links:
Jede Verknüpfung war symmetrisch:
Du konntest sehen, wer dich zitierte – und von wo aus.
Linkziele speicherten Metadaten: Versionen, Ursprung, Autor. - Versionsverwaltung:
Inhalte konnten überarbeitet, aktualisiert und in Varianten zitiert werden. - Micropayments:
Für jede transkludierte Einheit sollte ein winziger Betrag fließen – als ökonomisches Rückgrat für digitale Textkultur.
Transklusive vs. transiente Links
Mein Einsatz von archive.org – mit Zeitnähe zum Veröffentlichungsdatum – ist ein kleiner Versuch, diese transklusive Idee in der Praxis umzusetzen.
- Transklusive Links binden ein konkretes Fragment in genau der Version ein, die zur Entstehung des referenzierenden Dokuments relevant war: „Zeig mir, was ich damals gesehen habe.“
- Transiente Links hingegen verweisen auf eine lebende Ressource, bei der erwartet wird, dass sie sich verändert: „Führ mich zur aktuellen Version.“
Nur Letztere sind anfällig: Wenn das Ziel verschwindet, bleibt oft nichts – außer einem toten Link. Transklusive Links hingegen bewahren Kontext. Sie sind Zeitmaschinen im Text.
Zukunftssichere Langzeitarchivierung
Für kritische, transklusive Links gilt eigentlich das Gegenteil der üblichen Empfehlung: Erstelle zuerst einen Snapshot – und verlinke dann die Kopie.
Perma.cc ist einer der Dienste, die dafür gemacht sind: Webseiten in ihrem momentanen Zustand einfrieren, um sie als verlässliche Quelle zitieren zu können.
Auch das Internet Archive bietet diese Möglichkeit:
https://web.archive.org/save/URL
Eigene Archive
Im W3C-Kultartikel Cool URIs don't change wird ein Gedanke formuliert, der selten beherzigt wird: Überlege dir nicht nur, wie du Inhalte veröffentlichst – sondern auch, wie und wann du sie zurückziehst. Ein Ablaufdatum für Artikel. Yin zum Yang des Publizierens. Doch viele CMS unterstützen das nicht. Und Blogsysteme noch weniger.
Alternative: Nicht löschen – verwandeln. Inhalte, die schlecht gealtert sind, müssen nicht verschwinden. Sie können aus dem Hauptfluss genommen werden – aber weiterhin zugänglich bleiben. Kein aktiv beworbenes Archiv, sondern ein langsames Regal. Die Greatest Hits bleiben oben – die B‑Rolle zieht um.
Wie Websites lernen
Während ich hier restaurierte, fühlte es sich an wie in „How Buildings Learn: What Happens After They’re Built“ von Stewart Brand.
Das Buch zeigt, wie sich Gebäude durch Nutzung verändern – und warum anpassbare Bauten überleben, während starre ersetzt werden. Meine Site war einst Wiki, dann mehr Journal, jetzt vielleicht eher Archiv mit gelegentlichen Gedanken.
Schichtung und Veränderbarkeit
Brand unterscheidet sechs Ebenen eines Gebäudes: Site, Structure, Skin, Services, Space Plan, Stuff – jede mit ihrem eigenen Rhythmus der Veränderung.
Ebene | Digital übersetzt |
---|---|
Stuff | Inhalte, Texte, Medien, Metadaten |
Space Plan | Navigation, Kategorien, Tags, Archivstruktur |
Services | Static Site Generator, Markdown Processor |
Skin | Layout, Typografie, Farben, CSS |
Structure | URL-Schema, Permalinks |
Diese Schichtung macht Wandel möglich – ohne Bruch. Und sie erinnert daran, dass Alter kein Makel ist.
Wabi-sabi (侘び寂び)
Was in der Architektur Schichtung ist, nennt sich in der japanischen Ästhetik Wabi-sabi: die Akzeptanz von Vergänglichkeit, Unvollkommenheit und stetiger Veränderung. Eine Wabi-sabi-Sache ist nie „fertig“, sondern zeigt offen ihre Gebrauchsspuren. Ihre Schönheit liegt in der Zeit, im Gewordensein, im Gelebten.
Meine kaputten Permalinks sind jetzt ebenfalls Geschichte. Nicht aus nostalgischem Trotz, sondern weil Bedeutung sich in Schichten bildet.
Internet-Fossilien
Mein erster Studentenjob am DESY Hamburg bestand darin, den deutschen Pavillon der Internet 1996 World Expo zu pflegen – unter https://park.org/Germany/. An sich nichts Weltbewegendes. Wäre diese Site nicht eine der ältesten, die heute noch online sind [Gizmodo]. Es ist einfach ein gutes Gefühl, wenn digitale Zeitdokumente überdauern.
Entropie: fürs Erste besiegt.
Kein Text über das Internet Archive wäre vollständig ohne den Hinweis auf die vielleicht beste Spende an … Empfänger: Internet.
Denn der Wert liegt nicht nur in der Zukunft des Netzes. Sondern ebenso in seiner Vergangenheit. In digitaler Erinnerung.
Memento mori.
Links
Die erste Regel des Hypertexts: Verändere nie deine URLs.
- Cool URIs don't change (1998)
- The Value of a Broken Link (2012)
- Perma.cc – Websites change. Perma Links don’t.
« zurück blättern »