Ratgeber Langzeitarchivierung

Auf immer und ewig archiviert

09.04.2014
Von 
Bernd Reder ist freier Journalist und Autor mit den Schwerpunkten Technologien, Netzwerke und IT in München.
Die gesetzeskonforme und revisionssichere Langzeitarchivierung von Dokumenten ist eine Wissenschaft für sich. Papierdokumente sind auch nach Jahrhunderten noch zugänglich. Dagegen müssen für elektronische Daten spezielle Vorkehrungen getroffen werden, damit sie nach zehn Jahren oder später noch lesbar sind. Eine Schlüsselrolle spielt die Wahl der Archivierungsmedien und der Dateiformate.

Papier ist nicht nur geduldig, es eignet sich auch hervorragend als Träger für Informationen, die rechtskonform und revisionssicher archiviert werden müssen. Wird es richtig gelagert, kann ein Dokument aus säurefreiem Papier mehrere Hundert Jahre überdauern. Doch mittlerweile liegen immer mehr Daten nur noch in elektronischer Form vor: Steuerdokumente, Verträge, Entwicklungsunterlagen oder Umsatzstatistiken. Und an die Stelle des Briefs oder des Fax-Dokuments treten E-Mails und Instant Messages.

Je nach Branche gelten in Deutschland unterschiedliche Vorgaben in Bezug auf die Langzeitarchivierung von Unterlagen. Besonders lange müssen Dokumente im medizinischen Bereich aufbewahrt werden.
Je nach Branche gelten in Deutschland unterschiedliche Vorgaben in Bezug auf die Langzeitarchivierung von Unterlagen. Besonders lange müssen Dokumente im medizinischen Bereich aufbewahrt werden.
Foto: BMWi

Viele dieser Unterlagen müssen Jahre, teilweise Jahrzehnte lang aufbewahrt werden. Bei Geschäftsunterlagen beträgt der vom Gesetzgeber vorgegebene Archivierungszeitraum bis zu zehn Jahre, bei Patientendaten sind es bis zu 30 Jahre. Für Gebäudepläne, Katastereinträge und Unterlagen für medizinische Geräte gilt, dass sie über den gesamten Lebenszeitraum hinweg aufbewahrt werden müssen.

Differenzierung Archivierung und Backup

Häufig werden die Begriffe "Backup" und "Archivierung" fälschlicherweise in einen Topf geworfen. Beide Verfahren unterscheiden sich jedoch in wesentlichen Punkten:

Backup: Es wird eine Kopie von Produktionsdaten für den Fall erstellt, dass diese durch Benutzerfehler oder einen Hardware-Defekt verloren gehen und wiederhergestellt werden müssen. Als Speichermedium für Backup-Daten dienen Festplatten beziehungsweise Storage-Systeme, Bänder (Tapes) und Cloud-basierte Online-Speicher. Backups decken in der Regel ein schmales Zeitfenster ab, je nach Branche und Geschäftsfeld reicht es von wenigen Stunden bis hin zu mehreren Monaten. Wichtig ist das möglichst schnelle Wiederherstellen (Retention) von verlorengegangenen Datenbeständen.

Archivierung ist das systematische und langfristige Verlagern von Daten von Produktivsystemen auf spezielle Datenträger wie Magnetbänder, optische Speichermedien oder Festplatten. Die Daten müssen in einer Form archiviert werden, die nachträgliche Änderungen unterbindet. Bei der Langzeitarchivierung ist eine Aufbewahrung über einen Zeitraum von zehn Jahren und länger gefordert.

Warum Langzeitarchivierung wichtig ist

Für Unternehmen ist das Langzeitarchivieren von Unterlagen aus mehreren Gründen unverzichtbar. Zum einen erfordern gesetzliche Vorgaben wie das Handelsgesetzbuch, die Abgabenordnung (AO) und die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU), dass Firmen Geschäftsdaten bis zu zehn Jahre lang aufbewahren. Diese Daten müssen Firmen Behörden, etwa dem Finanzamt, bei Bedarf umgehend und in einem maschinenlesbaren Format zur Verfügung stellen.

Der zweite Punkt ist die Beweissicherung, beispielsweise im Rahmen eines Schadenersatzprozesses wegen eines angeblichen Konstruktionsfehlers eines Produkts. Dann muss ein Unternehmen auch noch nach Jahrzehnten die Originalunterlagen vorlegen können. Damit ein archiviertes elektronisches Dokument als Beweismittel zugelassen wird, ist es allerdings erforderlich, kryptografisch signierte Dokumente in ihrem Beweiswert zu sichern und sie nötigenfalls zusammen mit den Metadaten, Signaturen und Beweissicherungen (Evidence Records) zu exportieren. Das erfolgt mithilfe einer Middleware. Details dazu hat das Bundesamt für Sicherheit in der Informationstechnik (BSI) in der Technischen Richtlinie (TR) 03125 fixiert. Eine vom BSI zertifizierte beweiswerterhaltende Langzeitarchivierungslösung ist beispielsweise SecDocs von Fujitsu.

Eine Langzeitarchivierung von Daten bietet weiterhin die Möglichkeit, auf vorhandenes Know-how zurückzugreifen oder dieses bei Bedarf an Interessenten zu verkaufen (Verwertung von Patenten). Für öffentliche Einrichtungen wie Bibliotheken oder staatliche Archive ist die Langzeitarchivierung von Dokumenten die Grundlage ihrer Tätigkeit.

Verfügbarkeit von Datenträgern und Laufwerken berücksichtigen

Bezogen auf die gespeicherten Datenmengen dominieren im Bereich Archivierung laut der Marktforschungsgesellschaft ESG weltweit drei Speichermedien: Externe und interne Festplatten sowie Tapes. Cloud-basierte Archivierungsangebote gewinnen jedoch an Boden.
Bezogen auf die gespeicherten Datenmengen dominieren im Bereich Archivierung laut der Marktforschungsgesellschaft ESG weltweit drei Speichermedien: Externe und interne Festplatten sowie Tapes. Cloud-basierte Archivierungsangebote gewinnen jedoch an Boden.
Foto: ESG

Wenn Daten zehn Jahre oder länger aufbewahrt werden sollen, spielen die Archivierungsmedien und die entsprechenden Schreib-/Lesesysteme eine zentrale Rolle. Eines der größten Probleme ist, dass zu wenige gesicherte Daten über die Haltbarkeit von Speichermedien wie Magnetbänder, Festplatten, DVDs oder Flash-Speicher verfügbar sind. Bei optischen Medien gilt eine Lebensdauer von 10 bis 30 Jahren als realistisch, bei Festplatten sind es etwa 5 Jahre. Magnetbänder können 30 Jahre oder mehr überstehen. Anwender sind allerdings gut beraten, wichtige Daten rechtzeitig auf neue Medien umzukopieren. Als Faustregel gilt, dass dies bei optischen Medien und Bändern alle fünf Jahre erfolgen sollte. Flash-Speicher wie Solid State Drives (SSDs) werden derzeit so gut wie gar nicht als Archivierungsmedien eingesetzt. Dazu sind sie schlichtweg zu teuer.

Eignung von Medien für Langzeitarchivierung

Anforderung

Festplatte

Tape

Optische Medien

Für häufige Zugriffe ausgelegt

ja

nein

nein

Kurze Zugriffszeiten

ja

nein

je nach Medium

Kurze Archivierungsdauer (< 1 Jahr)

ja

ja

ja

Mittlere Archivierungsdauer (< 10 Jahre)

nein

ja

ja

Lange Archivierungsdauer (10 - 20 Jahre)

nein

ja

ja

Auslagerung des Mediums möglich

nein

ja

ja

Daten nicht veränderbar

nein

mit WORM-Tape

mit WORM-Disk

Quelle: NESTOR-Handbuch Version 2.3

Zu berücksichtigen ist zudem, wie lange die Hard- und Software zur Verfügung steht, mit der sich archivierte Daten auslesen lassen. Zwei Beispiele: Die US-Weltraumbehörde NASA kann nicht mehr auf Magnetbänder mit Daten der Mars-Sonden Pioneer und Viking zugreifen, weil die entsprechenden Bandlaufwerke vom Markt verschwunden sind. Ein vergleichbares Problem ist bei Archivdaten der ehemaligen DDR aufgetreten.

NASA - Archivierung der Superlative

Archiv der Superlative: Die Advanced Supercomputing Division der US-Raumfahrbehörde NASA hat Daten in einer Tape Library mit 115 Petabyte Kapazität archiviert. Das System stammt von SGI.
Archiv der Superlative: Die Advanced Supercomputing Division der US-Raumfahrbehörde NASA hat Daten in einer Tape Library mit 115 Petabyte Kapazität archiviert. Das System stammt von SGI.
Foto: NASA / SGI

Die Weltraumbehörde NASA setzt zum Archivieren der Daten ein Bandspeicher-System mit 115 Petabyte Kapazität ein. Die Arbeitsdaten liegen auf Festplatten-Storage-Systemen (RAID) und werden auf Tapes verlagert (Disk to Tape), wenn NASA-Fachleute sie nicht mehr benötigen. Aus Sicherheitsgründen werden von jedem Datensatz zwei Kopien erstellt und in separaten Gebäuden gespeichert.

Als Server für die Archivierung der Daten setzt die NASA zwei Altix-4700-Hochleistungsmaschinen von SGI ein, die über Fibre-Channel-Festplatten mit 380 beziehungsweise 535 TByte Kapazität verfügen.
Die Server übermitteln Daten, die archiviert werden sollten, mit 5 GBit/s über ein Storage Area Network zu einem Tape-Speichersystem der Reihe SGI Spectra Logic mit 115 Petabyte Volumen. Die sechs Tape Libraries verfügen über 59.120 Slots. Zudem kommen 92 LTO-5-Tape-Laufwerke zum Einsatz.