Daten für die Ewigkeit

04.08.2009
Das Bundesarchiv verwahrt Millionen von Akten und Fotos, die mit Hilfe des "Archivemanagers" digitalisiert werden.

Bei uns werden all die Unterlagen archiviert, die von anderen Bundesbehörden nicht mehr dauernd benötigt werden", beschreibt IT-Leiter Wilhelm Valder die Aufgabe des Bundesarchivs. "Wir sichern die Dokumente, erschließen sie und machen sie für die Öffentlichkeit nutzbar." Seit mehr als 20 Jahren werden auch digitale Unterlagen im Original gespeichert.

9,2 Millionen Dateien

Der Datenbestand umfasst inzwischen rund 9,2 Millionen Dateien. Sie verteilen sich auf 203 digitale Archivobjekte, also inhaltlich zusammengehörende Datenkomplexe. Dazu gehören die Volkszählungsdaten der DDR von 1971 und 1981, die Ermittlung und Entschädigung von NS-Zwangsarbeitern oder die Beschäftigtenstatistik der Bundesanstalt für Arbeit. "Die ältesten digitalen Daten stammen aus den 70er Jahren und können heute noch interpretiert werden", sagt Valder.

Da die papiergebundene Verwaltung voraussichtlich weiter abnimmt, während die Behörden zunehmend mit elektronischen Fachsystemen und elektronischer Vorgangsbearbeitung operieren, muss das Bundesarchiv auf die Abgabe von immer größeren Datenmengen vorbereitet sein. Die bislang vorhandene Infrastruktur war dafür allerdings nicht ausgelegt.

IT-Landschaft mit Linux

Seit Sommer 2008 werden im Rahmen des Pilotprojekts "Digitales Archiv" elektronische Unterlagen auf einem Speichersystem von Hewlett-Packard (HP) archiviert. Als Archivierungssoftware verwendet das Bundesarchiv den "Archivemanager" der Grau Data AG, Schwäbisch Gmünd. Die Lösung ist in der Lage, Daten bis in den Petabyte-Bereich (1 Petabyte = 1000 Terabytes) zu sichern und selbständig in einem zentralen Speichersystem zu archivieren. Die Daten lassen sich zum Beispiel von Festplatte zu Festplatte und/ oder auf Magnetbänder parallel kopieren und aufbewahren.

Die Software unterstützt die Netzwerkprotokolle CIFS und NFS, zudem verfügt sie über eine offene Filesystem-Schnittstelle. Sie arbeitet mit jeder gängigen Third-Party-Archivapplikation zusammen. Zum Einsatz kommt sie überall dort, wo große Datenmengen zur Archivierung anfallen – etwa bei Videoproduktionen, in Krankenhäusern, beim Bayerischen Rundfunk sowie Polizeiorganisationen.

Entscheidend bei der Auswahl der neuen Lösung waren für IT-Leiter Valder folgende Kriterien: Die Daten müssen sich auf unbegrenzte Zeit, revisionssicher und gemäß diversen Compliance-Bestimmungen – etwa GoBS und GDPdU – aufbewahren lassen. Darüber hinaus soll die Archivierung extrem großer Datenmengen möglichst kostengünstig erfolgen. Der Archivemanager als zentraler Archivspeicher passte in dieses Konzept: "Die Lösung unterstützt das Betriebssystem Linux, das bei uns überwiegend im Einsatz ist", erläutert Valder. "Und sie sorgt dafür, dass die richtigen Informationen zur richtigen Zeit am richtigen Ort verfügbar sind."

Der Archivemanager schreibt die Daten zunächst auf eine Festplatte – die Performance Disk – und bereitet sie für die Archivierung vor. Nach einer definierten Zeitspanne und individuell festgelegten Richtlinien werden die Informationen dann auf verschiedenen Medien abgelegt – etwa auf revisionssicheren, weil nicht überschreibbaren WORM-Medien.

Für die Bänder sprachen laut Valder vor allem wirtschaftliche Gründe. Vorteilhaft sei auch, dass der Archivemanager mehrere Medien gleichzeitig beschreiben kann. Die Daten auf den Speichermedien können jederzeit gelesen werden, das Programm arbeitet hardware- und softwareunabhängig. Und es verbessert die Servicequalität: Durch die automatisierte Verlagerung von Dateien lassen sich mehrstufige Speicherlösungen im Sinne eines Hierarchical-Storage-Managements einfach verwalten und an die jeweiligen Geschäftsanforderungen anpassen. Dies reduziert den Administrationsaufwand und entlastet das IT-Personal.

Bänder sind billiger

Einsparungen verzeichnet Valder aber auch außerhalb des eigentlichen Archivierungsprojekts: "Wir bekommen ab und zu digitalisierte Bestände, die auf Platten liegen, auf die jedoch äußerst selten zugegriffen wird. Und das ist sehr teuer." Mit Hilfe des Archivemanagers ließen sich diese Bestände auf deutlich preiswertere Bänder verlagern. Auch Millionen von Fotos im TIF-Format, die im Bildarchiv auf teuren Platten liegen, wanderten auf Bänder, um wieder Platz zu schaffen. (sp)

Auswahlkriterien

  • Unbegrenzte, revisionssichere Ablage;

  • Erfüllen von Compliance-Bestimmungen wie GDPdU und GoBS;

  • preiswerte Verwaltung großer Datenmengen;

  • Linux-Unterstützung.