21.7.2025

Wie Websites lernen

Das letzte Lebenszeichen: 13 Jahre her.
Das aktuelle Design: 19 Jahre alt.
Diese Site war mal mein ganzer Stolz.
Zeit, ihr neues Leben einzuhauchen …

Schritt 1: Entropie zurücksetzen!

Tote Links heilen

„Das Netz vergisst nicht“ ist ein Irrtum. Jeden Tag wird im Web gelöscht, verschoben, vergessen – unsere Links führen ins Leere. Zum Glück gibt es ein Schattenreich, in dem verlorene URLs weiterleben.

Als hätte jemand Seiten aus einem Buch gerissen, in dem man gern noch lesen würde – eine Website mit kaputten Links wirkt ungepflegt, veraltet.

Also habe ich die Site wieder etwas auf Zack gebracht:

  • 284 gebrochene Links durch Archiv-LinksWayback Machine repariert – mit Icon und Tooltip-Datum zur Wayback Machine
  • 31 echte Linkleichen durch gestrichelte Unterlinie gekennzeichnet
  • meine Podcastepisoden wiederhergestellt – MP3s selbstgehostet & neuen Feed erstellt
  • meinen Static Site Generator von Rails 1.1.4 (2006) auf Rails 8 migriert

Wayback Machine & Internet Archive

Das Internet Archive ist die wohl bekannteste Plattform, um Vergangenes zu bewahren. Gegründet 1996 mit der Weitsicht, dass das Web ein dynamisches, wachsendes Artefakt von kulturellem Wert ist, archiviert die Wayback Machine heute das halbe Internet.

Zeitanker: Warum restaurierte Links großartig sind

Ein kleiner Trick erlaubt, auf genau den Moment zu verlinken, den ich damals gesehen habe. „Ein Memento.“ Jeder restaurierte Link bewahrt Kontext, Erinnerung, Integrität. Ich nenne sie deshalb Zeitanker: <a>(t) – ein Link mit eingebauter Zeitmarke. Aber das Beste?

Archiv-Replay-Modus

Die Wayback Machine ist mehr als eine Zeitkapsel. Folgt man dort einem Link, stellt sie den zeitlichen Kontext wieder her. Man surft durch die Vergangenheit – exakt im Zeitkorridor, in dem man war. Willkommen in deinem eigenen Web‑Zeitreise‑Modus.

Einstieg in die Zeitmaschine

Die Kurzformel für den Sprung ins Archiv: URL anhängen – fertig:
https://web.archive.org/web/*/URL

Das Sternchen ist ein Joker für den Zeitpunkt und öffnet eine Kalenderansicht aller gespeicherten Snapshots.

Pro-Tipps

Zeige alle im Archiv bekannten Dateien als große Tabelle:
https://web.archive.org/web/*/http://frankwestphal.de/*

Grenze die Anzeige auf bestimmte Pfade oder URL-Muster ein:
https://web.archive.org/web/*/frankwestphal.de/ftp/*

Springe gezielt zu einem Monat oder Jahr deiner Wahl:
https://web.archive.org/web/201005*/https://rivva.de

Das Sternchen ist mächtiger als man denkt.

Mein Restaurationstrick: <a>(t) mit t = a.t

Machst du statt des Sternchens eine Zeitangabe, landest du genau dort:
https://web.archive.org/web/YYYYMMDDhhmmss/URL

Wenn wir als Zeitpunkt t nun das Veröffentlichungsdatum a.t unseres Artikels a einsetzen – also dort, wo der kaputte Link steht: <a>(t) –, sucht die Wayback Machine automatisch den Snapshot, der diesem Zeitpunkt am nächsten liegt. Für die Restaurierung historischer Inhalte ein Gamechanger.

Websitearchäologie

Im Zeitreisezyklus von Connie Willis können Historiker nur zu bestimmten Koordinaten in Raum und Zeit reisen. William Gibson nannte sie „Nodal points“ – jene Momente, an denen „etwas kippt“, an denen sich die Zukunft verzweigt.

Für Ausflüge ins gestrige Web brauchen wir solche Startpunkte. Sie sind entscheidend für das richtige Feeling, um sich – ganz im Flow – durch vergangene Weblandschaften treiben zu lassen.

Der Wert kaputter Links

Aus diesem Grund sind veraltete Links um Längen besser als Löschen oder Abschalten. Tote Links sind belegende Artefakte, kein Mangel – richtig gekennzeichnet, zeigen sie Quellenlage. So lassen sich Inhalte oft noch rekonstruieren – über die URL, über Archive, über Kontext.

Die Library of Congress schreibt: „if anything, the value of a broken link seems to be increasing“.

Es lohnt sich also, die Infrastruktur so zu gestalten, dass nicht nur die Inhalte gepflegt werden können – sondern ebenso ihre Beziehungen. Denn Links sind mehr als Verbindungen. Sie drücken Beziehungen aus. Und Beziehungen verdienen Pflege.

Meine Restaurationsstrategie

Preprocessing: Tote Links finden

  • alle Artikel nach externen Links scannen
  • jeden Link prüfen auf Erreichbarkeit (200 OK) und Jaccard-Ähnlichkeit (gleicher Inhalt wie damals oder Domain verkauft?)
  • für alle kaputten Links die Wayback Availability API befragen
  • Ergebnisse in einer YAML-Datei zusammentragen

Die YAML-Datei erlaubt dann, kaputte URLs auf reparierte URLs abzubilden. So kann der zuvor beschriebene Zeitanker (Standardverhalten: t = a.t) bei Bedarf überschrieben werden.

Ziel war: Texte erhalten, Links beleben. Mit klarer Trennung von Inhalt und Logik. Das HTML bleibt unabhängig vom YAML. URLs werden nicht hart ersetzt, sondern durch eine transparente Logik behandelt. So bleiben die Original-URLs im Quelltext erhalten – lesbar und nachvollziehbar.

Postprocessing: Tote Links live umschreiben

  • im HTML erneut alle Links extrahieren – diesmal zur Laufzeit
  • externe Links durch das YAML-Mapping filtern
  • reparierte Links transparent umleiten (Decorator Pattern)
  • archivierte und verwaiste Links visuell kennzeichnen

Ziel war: Inhalte bewahren, Struktur respektieren. Alle Änderungen sind nicht-destruktiv. Der Originaltext bleibt unangetastet – die Reparatur erfolgt rein visuell, als zarte Schicht darüber. Wie eine Goldnaht im Kintsugi-Stil: sichtbar, ehrlich, reversibel.

Digitale Patina

Was mir wichtig war: Nicht löschen, sondern verwandeln.

Die Hypertext-Ästhetik sollte erhalten bleiben – Links sind Teil des Leseflusses, sie schaffen Bedeutung und Orientierung. Wenn man kaputte Links einfach entfernt, geht oft mehr verloren als nur die Verknüpfung: Der Text verliert insgesamt.

Die Lösung: Alte Inhalte mit Veröffentlichungsdatum ins Internet Archive spiegeln. Das kleine IA-Icon wirkt dabei wie eine digitale Patina: Ein sichtbares Zeichen dafür, dass es sich um eine archivierte Kopie handelt, nicht die voll funktionsfähige Originalseite.

Xanadu (1960)

Ted Nelsons Xanadu-Projekt war seiner Zeit weit voraus. Es dachte Hypertext radikal anders: Links waren nicht bloße Verweise, sondern aktive Beziehungen zwischen lebendigen Inhalten.

  • Transklusion statt Kopie:
    Inhalte wurden nicht dupliziert, sondern als Segmente virtuell eingebunden – mit Herkunft, Kontext und Versionsgeschichte.
  • Unbrechbare, bidirektionale Links:
    Jede Verknüpfung war symmetrisch:
    Du konntest sehen, wer dich zitierte – und von wo aus.
    Linkziele speicherten Metadaten: Versionen, Ursprung, Autor.
  • Versionsverwaltung:
    Inhalte konnten überarbeitet, aktualisiert und in Varianten zitiert werden.
  • Micropayments:
    Für jede transkludierte Einheit sollte ein winziger Betrag fließen – als ökonomisches Rückgrat für digitale Textkultur.

Transklusive vs. transiente Links

Mein Einsatz von archive.org – mit Zeitnähe zum Veröffentlichungsdatum – ist ein kleiner Versuch, diese transklusive Idee in der Praxis umzusetzen.

  • Transklusive Links binden ein konkretes Fragment in genau der Version ein, die zur Entstehung des referenzierenden Dokuments relevant war: „Zeig mir, was ich damals gesehen habe.“
  • Transiente Links hingegen verweisen auf eine lebende Ressource, bei der erwartet wird, dass sie sich verändert: „Führ mich zur aktuellen Version.“

Nur Letztere sind anfällig: Wenn das Ziel verschwindet, bleibt oft nichts – außer einem toten Link. Transklusive Links hingegen bewahren Kontext. Sie sind Zeitmaschinen im Text.

Zukunftssichere Langzeitarchivierung

Für kritische, transklusive Links gilt eigentlich das Gegenteil der üblichen Empfehlung: Erstelle zuerst einen Snapshot – und verlinke dann die Kopie.

Perma.cc ist einer der Dienste, die dafür gemacht sind: Webseiten in ihrem momentanen Zustand einfrieren, um sie als verlässliche Quelle zitieren zu können.

Auch das Internet Archive bietet diese Möglichkeit:
https://web.archive.org/save/URL

Eigene Archive

Im W3C-Kultartikel Cool URIs don't change wird ein Gedanke formuliert, der selten beherzigt wird: Überlege dir nicht nur, wie du Inhalte veröffentlichst – sondern auch, wie und wann du sie zurückziehst. Ein Ablaufdatum für Artikel. Yin zum Yang des Publizierens. Doch viele CMS unterstützen das nicht. Und Blogsysteme noch weniger.

Alternative: Nicht löschen – verwandeln. Inhalte, die schlecht gealtert sind, müssen nicht verschwinden. Sie können aus dem Hauptfluss genommen werden – aber weiterhin zugänglich bleiben. Kein aktiv beworbenes Archiv, sondern ein langsames Regal. Die Greatest Hits bleiben oben – die B‑Rolle zieht um.

Wie Websites lernen

Während ich hier restaurierte, fühlte es sich an wie in „How Buildings Learn: What Happens After They’re Built“ von Stewart Brand.

Das Buch zeigt, wie sich Gebäude durch Nutzung verändern – und warum anpassbare Bauten überleben, während starre ersetzt werden. Meine Site war einst Wiki, dann mehr Journal, jetzt vielleicht eher Archiv mit gelegentlichen Gedanken.

Schichtung und Veränderbarkeit

Brand unterscheidet sechs Ebenen eines Gebäudes: Site, Structure, Skin, Services, Space Plan, Stuff – jede mit ihrem eigenen Rhythmus der Veränderung.

Shearing Layers

Ebene Digital übersetzt
Stuff Inhalte, Texte, Medien, Metadaten
Space Plan Navigation, Kategorien, Tags, Archivstruktur
Services Static Site Generator, Markdown Processor
Skin Layout, Typografie, Farben, CSS
Structure URL-Schema, Permalinks

Diese Schichtung macht Wandel möglich – ohne Bruch. Und sie erinnert daran, dass Alter kein Makel ist.

Wabi-sabi (侘び寂び)

Was in der Architektur Schichtung ist, nennt sich in der japanischen Ästhetik Wabi-sabi: die Akzeptanz von Vergänglichkeit, Unvollkommenheit und stetiger Veränderung. Eine Wabi-sabi-Sache ist nie „fertig“, sondern zeigt offen ihre Gebrauchsspuren. Ihre Schönheit liegt in der Zeit, im Gewordensein, im Gelebten.

Meine kaputten Permalinks sind jetzt ebenfalls Geschichte. Nicht aus nostalgischem Trotz, sondern weil Bedeutung sich in Schichten bildet.

Internet-Fossilien

Mein erster Studentenjob am DESY Hamburg bestand darin, den deutschen Pavillon der Internet 1996 World Expo zu pflegen – unter https://park.org/Germany/. An sich nichts Weltbewegendes. Wäre diese Site nicht eine der ältesten, die heute noch online sind [Gizmodo]. Es ist einfach ein gutes Gefühl, wenn digitale Zeitdokumente überdauern.

Entropie: fürs Erste besiegt.

Kein Text über das Internet Archive wäre vollständig ohne den Hinweis auf die vielleicht beste Spende an … Empfänger: Internet.

Denn der Wert liegt nicht nur in der Zukunft des Netzes. Sondern ebenso in seiner Vergangenheit. In digitaler Erinnerung.

Memento mori.

Links

Die erste Regel des Hypertexts: Verändere nie deine URLs.

« zurück   blättern »