Digital Preservation, ein Konzept für Langzeitarchive

Analog und digital ergänzen sich

14.09.2001
Alles ist vergänglich - auch digital gespeicherte Informationen. Unternehmen, die ihre Daten dennoch lange lagern müssen, können dazu digitale und analoge Verfahren kombinieren. von Jürgen Neitzel*

Nie zuvor in der Geschichte hat eine Zivilisation so viele Informationen produziert wie heute. Die Zeugnisse jetziger und kommender Generationen existieren zunehmend in rein elektronischer Form. Der Großteil heutiger Dokumente wird digital erzeugt, als Bits und Bytes aufbewahrt und "stirbt" digital, ohne dass man jemals einen Ausdruck auf Papier erstellt hat. Die wachsende Bedeutung des Internets für private und geschäftliche Anwendungen dürfte diese Entwicklung noch beschleunigen.

Im Gegensatz zum physischen Zerfall von Papierdokumenten glaubte die IT-Welt lange Zeit, mit der digitalen Archivierung ein Allheilmittel gegen die Gefahr von Informationsverlusten zu haben. Mittlerweile ist allerdings Ernüchterung eingekehrt, und es setzt sich die Erkenntnis durch, dass auch digitale Dokumente vergänglich sind - mehr noch, dass

Papier lebt länger

die Lebensdauer digitaler Dokumente sogar weit unter der von Papierdokumenten liegt. "Digital Preservation" lautet ein Konzept, mit dem sich die langfristige Speicherung digitaler Daten sicherstellen lässt. Dieser Ansatz umfasst integrierte Lösungen, bei denen analoge Medien wie der Mikrofilm für die Langzeitarchivierung zum Einsatz kommen und Digitaltechnik für den schnellen, kurzfristigen Zugriff genutzt wird.

Zwei Beispiele mögen die Notwendigkeit von Digital Preservation verdeutlichen: So stellte man in den USA bereits in den 70er Jahren fest, dass ein Teil der Volkszählungsdaten von 1960 nicht mehr lesbar war. So ergibt sich die groteske Situation, dass die Volkszählung von 1860 noch immer vollständig verfügbar ist, nicht mehr aber die von 1960. Eine ähnliche "Datenkatastrophe" passierte der amerikanischen Raumfahrtbehörde NASA. Dort waren bis zu 20 Prozent der Informationen, die 1976 während der Viking-Mission zum Mars gesammelt wurden, verloren gegangen. Der Grund: Die magnetischen Speichermedien, auf denen die Informationen vorgehalten wurden, weisen Beschädigungen auf und sind teilweise unlesbar geworden.

Digital Preservation ist insbesondere für alle Organisationen eine Option, die Informationen zehn, zwanzig, dreißig Jahre und länger authentisch aufbewahren müssen. Das sind zum Beispiel Finanzinstitute, Versicherungen, öffentliche Verwaltung, Industrie, Forschung und Gesundheitswesen.

Die Herausforderungen, die sich aus der digitalen Speicherung ergeben, fallen im Wesentlichen in zwei Bereiche: zum einen die Datenmedien und zum anderen die beschleunigte technologische Entwicklung. Viele Speichermedien besitzen nur eine begrenzte Lebensdauer. Eine Studie des National Media Laboratory in den USA kommt zu dem Ergebnis, dass magnetische Speichermedien (dazu gehören Disketten, Festplatten sowie analoge und digitale Videobänder) eine Lebenserwartung von weniger als 30 Jahren haben. Bei optischen Speichermedien (wie CD und DVD) liegt die Lebenserwartung zwar deutlich höher, jedoch können auch hier Datenausfälle auftreten. Teils kommt es zu einer Korrosion der Metalle, teils zu kleinen Veränderungen der magnetischen und optischen Bereiche, welche die Informationen erhalten. Feuchtigkeit und Wärme beschleunigen den Zerfall. Hinzu kommt ein weiteres Problem: Manchmal genügt ein einziger Lesefehler, das heißt eine fehlerhafte Stelle auf einem Datenträger, und der ganze Inhalt ist nicht mehr zu gebrauchen.

Digitale Informationen stellen zudem unabdingbare Ansprüche an die Geräte, mit denen sie gelesen werden sollen. Heutige Anwender sind völlig abhängig vom Zugang zu den richtigen Maschinen und der dazu passenden Software geworden. Und die Technik von heute ist oft nicht mehr kompatibel mit der Technik von morgen. Software und Geräte veralten mit rasender Geschwindigkeit. Jeder, der heute versucht, Daten auf einer 51/4-Zoll-Diskette auszulesen, weiß davon ein Lied zu singen.

Hohes Kostenrisiko

Ein Ausweg aus dem Dilemma scheint zunächst die permanente Migration zu bieten. Sämtliche Daten müssen in regelmäßigen Abständen jeweils auf die neueste Hard- und Softwaregeneration kopiert werden. Allerdings erfordert das einen enormen Zeitaufwand. Zum anderen können die dabei entstehenden Kosten unkalkulierbar werden. Interne Schätzungen von Kodak gehen davon aus, dass Unternehmen für die Migration 2,5-mal mehr ausgeben müssen als sie für die Erzeugung aufgewandt haben.

Und letztlich das Entscheidende: Allzu oft machen nicht alle Bits diese Migration mit, wenn Daten von einem Medium zum nächsten übertragen werden. Manchmal geht eine Fußnote verloren, ein anderes Mal ein ganzer Datenabschnitt. Im Zeitalter der Rechtsstreitigkeiten kann dieser Zustand, dass Teile der Daten durch Migration verloren gehen, allerdings fatale Folgen haben.

Eine Archivierungsstrategie, die langfristig Daten und Informationen sichert, muss daher folgende Anforderungen erfüllen:

- Langlebigkeit: Es muss dafür gesorgt werden, dass sich digitale Dokumente und Informationen auch noch nach einem längeren Zeitraum (von mehr als zehn Jahren) auslesen lassen, ohne dass der ursprüngliche Informationsinhalt, inklusive Formatierungen, verloren geht.

- Zudem muss die eingesetzte Digital-Preservation-Technologie mit existierender und zukünftiger Hard- und Software zusammenarbeiten und den Zugang zu gesicherten Dokumenten ermöglichen.

- Total Cost of Ownership: Angestrebt wird, die Speicherkosten eines Dokuments während des gesamtes Lebenszyklus# so gering wie möglich zu halten. Dies umfasst Kapitalausgaben, Kosten für Speichermedien, Wartungs- und Betriebsausgaben sowie Kosten für eine eventuelle Migration.

- Schutz vor "Veralterung" der Technologie: Informationen, die in digitalen Dokumenten enthalten sind, müssen auch mit zukünftiger Hard- und Software abrufbar sein.

Die Lösung für Digital Preservation liegt daher in einem integrierten Ansatz: Mikrofilm für die Langzeitarchivierung, digitale Speicherung für den schnellen, kurzfristigen Zugriff. Die Vorteile des analogen Speichermediums Mikrofilm überzeugen bei der Langzeitarchivierung. So besitzt der Mikrofilm eine lange Lebensdauer. Studien des US National Media Laboratory gehen von 500 Jahren aus. Zweitens sind Daten, die auf Mikrofilm gespeichert sind, mit dem menschlichen Auge lesbar und daher mit Hilfe von Mikrofilm-Lesegeräten leicht zugänglich. Drittens entstehen dem Anwender durch die analoge Backup-Lösung keinerlei zukünftige Migrationskosten. Besonders für Informationen, die selten oder nie recherchiert werden - jedoch aufgrund gesetzlicher Aufbewahrungsfristen archiviert werden müssen - stellt das analoge Speichermedium eine kostengünstige, sichere und migrationsfreie Backup-Lösung dar.

Beim Digital-Preservation-Prozess werden digitale Dokumente, die entweder originär digital vorliegen oder eingescannt wurden, zunächst von dem eingesetzten IT-System gesammelt. Für Dokumente, auf die man nur selten

Alternative Mikrofilm

zugreifen muss, die jedoch langfristig aufbewahrt werden müssen, kommt der Digital-Analog-Prozess in Betracht. Dabei schreiben Integrated-Imaging-Systeme die digitalen Dokumente auf Mikrofilm. In Verbindung mit einer speziellen Softwarelösung lassen sich digitale Dokumente direkt aus einem Dokumenten-Management-System übernehmen und auf Film schreiben. Die Archivdatenbank erstellt automatisch den Filmindex und verwaltet ihn.

Wird zu einem späteren Zeitpunkt die analog vorliegende Information erneut benötigt, so lässt sie sich mit Hilfe von Mikrofilm-Scannern wieder digitalisieren. Die digitalisierten Bilder kann man über bestehende Netzwerke an Anwender, Server oder Drucker sowie über E-Mail weltweit verschicken. Ein spezielles Softwaremodul ermöglicht den computerunterstützten Zugriff auf Mikrofilm-Informationen. Dadurch lassen sich Anfragen rationeller bearbeiten.

Wie eine Integrated-Imaging-Lösung in der Praxis aussehen könnte, zeigt das Beispiel einer deutschen Versicherung. Dort gehen täglich bei der Mikrofilmverwaltung bis zu 15 000 Anforderungen auf mikroverfilmte Akten ein. Die Mitarbeiter müssen jeden Tag rund 72 000 Bilder von Mikrofilmen auf Papier reproduzieren. Dies erledigte man bisher mit 30 analogen Rückvergrößerungsgeräten - eine Lösung, die Ressourcen und Zeit verschlang.

Kernstück der neuen Lösung sind mehrere Mikrofilm-Scanner in Verbindung mit spezieller Software zur Aufbereitung und Verteilung der Informationen. Jeden Morgen werden die Informationsanforderungen von einer Datenbankanwendung erfasst und danach die entsprechenden Mikrofilme in die Mikrofilm-Scanner eingelegt. Der Bediener muss nur noch die Aktenart eingeben. Aus dem Image-Management-Code wird die Filmnummer ausgelesen und das Scan-Programm fragt die Datenbank nach den zu digitalisierenden Fundstellen ab.

Der Mikrofilm-Scanner fährt die betreffende Bildadresse exakt an und scannt dann automatisch das gewünschte Dokument. Sind mehrere Fundstellen auf einem Film, werden alle Dokumente sofort digitalisiert. Während des Scan-Prozesses lassen sich Images automatisch bearbeiten. Die Vorder- und Rückseite der Duplexaufnahmen lassen sich einzeln darstellen. Anschließend übernimmt eine weitere Software die Aufbereitung der TIFF-Dateien zur Übergabe an den Druckserver. Zusätzlich können die digitalisierten Informationen direkt per Mail-Client versandt oder über das Intranet verteilt werden. Auch die Einbindung der Daten in elektronische Dokumenten-Management-Systeme ist möglich.

* Jürgen Neitzel ist freier Journalist in Stuttgart.

Links

www.digitalpreservation.org

www.kodak.de

www.agfa.de

www.kofile.de

www.dms-expo.de