Am Anfang war das Archiv

22.11.2004 von Bernhard Zöller
Obwohl die Archivierung eine altbekannte Technik ist, bildet sie noch immer den Ausgangspunkt für viele Content-Management-Projekte und ist nach wie vor eine wichtige Funktion der IT.

Hier lesen Sie ...

  • warum Archivierung auch nach 20 Jahren nicht an Bedeutung eingebüßt hat;

  • welche Archivformate für welche Zwecke geeignet sind;

  • was Firmen bei der E-Mail-Archivierung beachten sollten;

  • welche Zusatzfunktionen es für Archivlösungen gibt (elektronischer Postkorb, Workflow, Dokumentenklassifizierung und Indizierung).

Elektronische Dokumentenarchive gibt es in Deutschland seit über 20 Jahren. Aus den damaligen Anfängen hat sich der Markt mittlerweile in alle Branchen, alle Preisklassen und alle Unternehmensgrößen verbreitet. Über 30 Hersteller bieten hierzulande Systeme an, die der sicheren Archivierung aller Arten von aufbewahrungsrelevanten Dokumenten und anderen Unterlagen dienen. Es gibt aber kaum noch Softwarehäuser, die sich trauen, reine Archivsysteme anzubieten.

Vielmehr geht der Trend eindeutig in Richtung mehrfunktionaler Systeme, die - häufig unter dem Label "Enterprise Content Management" (ECM) - auch andere Content- beziehungsweise Dokumenten-Verwaltungsfunktionen erfüllen

Archivierung hat immer noch hohe Priorität

Trotz des Hypes um ECM ist die Teilfunktion Archivierung sehr häufig Projektauslöser und die erste realisierte ECM-Anwendung. Die Kernanforderungen an solche Systeme haben sich nicht geändert: Erfüllung der operativen und rechtlichen Archivpflichten und Reduktion der direkt und indirekt durch Dokumente entstehenden Kosten. Was sich aber zum Teil gravierend geändert hat, sind die technischen und funktionalen Elemente einer Archivlösung.

Alle großen Speicherhersteller haben den Archivmarkt entdeckt und bieten - begünstigt durch den rapiden Preisverfall - Magnetplatten an, die den optischen Platten den Alleinvertretungsanspruch für die "Write Once, Read Many" (WORM-)-Speicherung - also die Unveränderbarkeit archivierter Objekte - streitig machen. Dementsprechend vielfältig sind die Handlungsoptionen:

Der Gesetzgeber gewährt ausdrücklich diese Wahlfreiheit (so im Begleitschreiben des Bundesfinanzministeriums zu den Grundsätzen ordnungsgemäßer IT-gestützter Buchführungssysteme, kurz GOBS, aus dem Jahr 1995), auch wenn dies in der aktuellen Diskussion häufig anders dargestellt wird. Der Anwender muss allerdings in einer Verfahrensdokumentation die Wirksamkeit seiner Maßnahmen nachweisen.

Besondere Herausforderungen stellen Vielfalt und wachsende Mengen der intern erzeugten oder empfangenen elektronischen Dokumente dar. Das mittlerweile 20 Jahre alte Tagged Image File Format (Tiff) wird diesen Anforderungen nicht gerecht. Tiff ist eine Spezifikation für Bitmap-Dokumente und daher nicht geeignet, Compound-Formate (Text und Grafik gemischt auf einer Seite) aufzunehmen. Außerdem ist Tiff nicht direkt volltextfähig: ein Ascii-Report oder ein Word-Dokument, das "vertifft" wird, muss erst wieder per Optical Character Recognition (OCR) kodiert werden, um in dem Report nach Texten zu suchen. Die in Archiven am häufigsten verwendeten Tiffs sind bitonale Dokumente (rein schwarzweiß, keine Graustufen) und für Farbdokumente nicht nutzbar.

Das im Zusammenhang mit der Formatdiskussion häufig vorgebrachte Argument, Tiff sei revisionssicher, PDF und Word dagegen nicht, ist unsinnig. Tiff ist als Dateiformat geradezu lächerlich einfach zu manipulieren. Nicht das Dokumentenformat, sondern die Gesamtanwendung muss das Objekt so schützen, dass den Anforderungen aus Handels- und Steuerrecht Genüge getan wird. Mit der Ablage einer zunehmenden Vielfalt von Dokumentformaten entstehen neue Anforderungen:

Inzwischen verarbeiten Unternehmen aber nicht nur Dokumente, sondern auch viele E-Mails. Täglich werden rechtlich oder geschäftlich relevante Unterlagen verschickt und empfangen. Mail-Archivierung dient vor allem dazu:

In vielen Projekten sollen Mails in eine elektronische Akte gestellt werden, die auch die anderen zu diesem Aktenzeichen gehörenden Eingangs- und Ausgangsdokumente enthält. Das Mail-System ist jedoch nicht das geeignete Repository.

Client- oder Server-Ansatz bei der Mail-Archivierung

Die für den Anwender wichtigste Unterscheidung der verschiedenen Mail-Archivangebote ist die zwischen den Server-basierenden Systemen, die die Mails (oder deren Attachments) nach bestimmten Kriterien (Alter, Größe, Eintritt eines Events) in das Archiv ablegen, und den Client-basierenden Mail-Archivfunktionen, die es dem Mitarbeiter erlauben, individuelle Nachrichten zu archivieren und ihnen dabei bestimmte Indexwerte zuzuweisen. Letzteres funktioniert nicht bei der Server-gestützten Mail-Archivierung, wenn sich das Ordnungskriterium (etwa das Aktenzeichen) nicht automatisch aus dem Mailobjekt extrahieren lässt.

Web-Clients: Magersucht mit Folgen

Viele Anbieter haben ihre Systeme um Web-basierende Clients ergänzt. Das Präfix "Web" ist jedoch manchmal irreführend: Manche Hersteller haben Web-Clients als vollwertigen Ersatz für die Fat Clients eingeführt. Der Vorteil: Sie lassen sich im Internet, Extranet und Intranet ohne Architekturwechsel einsetzen. Die positiven Eigenschaften wie Plattformunabhängigkeit sorgen für hohe Akzeptanz und schnelle Verbreitung dieser Architektur. Die Softwarehersteller sind allerdings gezwungen, ihre Client-Anwendungen komplett neu zu schreiben. Dabei stellt sich die Frage nach der Wahl der richtigen Technik. Auf dem Client existiert eine Vielzahl unterschiedlicher, teilweise miteinander nicht kompatibler Optionen, die auch jeweils spezifische Nachteile aufweisen können:

Darüber hinaus gibt es eine Reihe weiterer Funktionen, die für die Anwender als Ergänzung ihrer Archiv-Features immer wichtiger werden: