Am Anfang war das Archiv

10.11.2004
Von Bernhard Zöller
Obwohl die Archivierung eine altbekannte Technik ist, bildet sie noch immer den Ausgangspunkt für viele Content-Management-Projekte und ist nach wie vor eine wichtige Funktion der IT.

Elektronische Dokumentenarchive gibt es in Deutschland seit über 20 Jahren. Aus den damaligen Anfängen hat sich der Markt mittlerweile in alle Branchen, alle Preisklassen und alle Unternehmensgrößen verbreitet. Über 30 Hersteller bieten hierzulande Systeme an, die der sicheren Archivierung aller Arten von aufbewahrungsrelevanten Dokumenten und anderen Unterlagen dienen. Es gibt aber kaum noch Softwarehäuser, die sich trauen, reine Archivsysteme anzubieten. Vielmehr geht der Trend eindeutig in Richtung mehrfunktionaler Systeme, die - häufig unter dem Label "Enterprise Content Management" (ECM) - auch andere Content- beziehungsweise Dokumenten-Verwaltungsfunktionen erfüllen

Archivierung hat immer noch hohe Priorität

Trotz des Hypes um ECM ist die Teilfunktion Archivierung sehr häufig Projektauslöser und die erste realisierte ECM-Anwendung. Die Kernanforderungen an solche Systeme haben sich nicht geändert: Erfüllung der operativen und rechtlichen Archivpflichten und Reduktion der direkt und indirekt durch Dokumente entstehenden Kosten. Was sich aber zum Teil gravierend geändert hat, sind die technischen und funktionalen Elemente einer Archivlösung.

Alle großen Speicherhersteller haben den Archivmarkt entdeckt und bieten - begünstigt durch den rapiden Preisverfall - Magnetplatten an, die den optischen Platten den Alleinvertretungsanspruch für die "Write Once, Read Many" (WORM-)-Speicherung - also die Unveränderbarkeit archivierter Objekte - streitig machen. Dementsprechend vielfältig sind die Handlungsoptionen:

- Entweder Speicherung auf optischen Platten, aber idealerweise 100 Prozent Cache auf Magnetplatte für den schnellen Zugriff;

- oder Nutzung der zentralen, sowieso vorhandenen Speichersysteme ohne spezielle Speicher-WORM-Funktionen. Hierbei werden die Objekte wirksam auf Anwendungsebene geschützt (Schutz durch Software ist für jede Finanzbuchhaltungssoftware ein alter Hut);

- und schließlich der Einsatz von WORM-Speichern auf Basis von Magnetspeichersystemen.

Der Gesetzgeber gewährt ausdrücklich diese Wahlfreiheit (so im Begleitschreiben des Bundesfinanzministeriums zu den Grundsätzen ordnungsgemäßer IT-gestützter Buchführungssysteme, kurz GOBS, aus dem Jahr 1995), auch wenn dies in der aktuellen Diskussion häufig anders dargestellt wird. Der Anwender muss allerdings in einer Verfahrensdokumentation die Wirksamkeit seiner Maßnahmen nachweisen.

Besondere Herausforderungen stellen Vielfalt und wachsende Mengen der intern erzeugten oder empfangenen elektronischen Dokumente dar. Das mittlerweile 20 Jahre alte Tagged Image File Format (Tiff) wird diesen Anforderungen nicht gerecht. Tiff ist eine Spezifikation für Bitmap-Dokumente und daher nicht geeignet, Compound-Formate (Text und Grafik gemischt auf einer Seite) aufzunehmen. Außerdem ist Tiff nicht direkt volltextfähig: ein Ascii-Report oder ein Word-Dokument, das "vertifft" wird, muss erst wieder per Optical Character Recognition (OCR) kodiert werden, um in dem Report nach Texten zu suchen. Die in Archiven am häufigsten verwendeten Tiffs sind bitonale Dokumente (rein schwarzweiß, keine Graustufen) und für Farbdokumente nicht nutzbar.

Das im Zusammenhang mit der Formatdiskussion häufig vorgebrachte Argument, Tiff sei revisionssicher, PDF und Word dagegen nicht, ist unsinnig. Tiff ist als Dateiformat geradezu lächerlich einfach zu manipulieren. Nicht das Dokumentenformat, sondern die Gesamtanwendung muss das Objekt so schützen, dass den Anforderungen aus Handels- und Steuerrecht Genüge getan wird. Mit der Ablage einer zunehmenden Vielfalt von Dokumentformaten entstehen neue Anforderungen:

- Integration in die PC-Umgebung des Anwenders inklusive Indizierung,

- optionale Volltextindizierung,

- gegebenenfalls duale Ablage als Tiff/PDF und im Original,

- Importer/Indizierer für Massendrucksachen,

- Host-Druckspools,

- Reports und Listen sowie unter Umständen Konverter, die diese Formate vor dem Archivieren oder beim Aufruf in ein anderes Format (Tiff, JPEG, PDF, HTML etc.) umwandeln.

Inzwischen verarbeiten Unternehmen aber nicht nur Dokumente, sondern auch viele E-Mails. Täglich werden rechtlich oder geschäftlich relevante Unterlagen verschickt und empfangen. Mail-Archivierung dient vor allem dazu:

- die Speichermengen zu reduzieren, um innerhalb kritischer Zeitfenster Backup- und Recovery-fähig zu sein;

- die Konformität mit regulatorischen Anforderungen sicherzustellen, die sich auch auf handels-, steuer- oder zivilrechtlich relevante E-Mail beziehen, dadurch längere Aufbewahrungsfristen vorschreiben und der häufigen Praxis widersprechen, Mailpostkörbe nur bis zu einer bestimmten Größe zuzulassen.

In vielen Projekten sollen Mails in eine elektronische Akte gestellt werden, die auch die anderen zu diesem Aktenzeichen gehörenden Eingangs- und Ausgangsdokumente enthält. Das Mail-System ist jedoch nicht das geeignete Repository.

Client- oder Server-Ansatzbei der Mail-Archivierung

Die für den Anwender wichtigste Unterscheidung der verschiedenen Mail-Archivangebote ist die zwischen den Server-basierenden Systemen, die die Mails (oder deren Attachments) nach bestimmten Kriterien (Alter, Größe, Eintritt eines Events) in das Archiv ablegen, und den Client-basierenden Mail-Archivfunktionen, die es dem Mitarbeiter erlauben, individuelle Nachrichten zu archivieren und ihnen dabei bestimmte Indexwerte zuzuweisen. Letzteres funktioniert nicht bei der Server-gestützten Mail-Archivierung, wenn sich das Ordnungskriterium (etwa das Aktenzeichen) nicht automatisch aus dem Mailobjekt extrahieren lässt.

Web-Clients: Magersucht mit Folgen

Viele Anbieter haben ihre Systeme um Web-basierende Clients ergänzt. Das Präfix "Web" ist jedoch manchmal irreführend: Manche Hersteller haben Web-Clients als vollwertigen Ersatz für die Fat Clients eingeführt. Der Vorteil: Sie lassen sich im Internet, Extranet und Intranet ohne Architekturwechsel einsetzen. Die positiven Eigenschaften wie Plattformunabhängigkeit sorgen für hohe Akzeptanz und schnelle Verbreitung dieser Architektur. Die Softwarehersteller sind allerdings gezwungen, ihre Client-Anwendungen komplett neu zu schreiben. Dabei stellt sich die Frage nach der Wahl der richtigen Technik. Auf dem Client existiert eine Vielzahl unterschiedlicher, teilweise miteinander nicht kompatibler Optionen, die auch jeweils spezifische Nachteile aufweisen können:

- Personenindividuelle Einrichtung der Oberfläche ist in vielen Fällen nicht implementiert oder sehr viel umständlicher.

- Drag and Drop wird häufig nicht unterstützt (Ausnahmen existieren).

- Das Browsen in hierarchischen Strukturen wie "Windows Explorer" fehlt oft (auch hier gibt es aber Ausnahmen).

- Integration der Desktop-Anwendungen wie Office ist komplex, falls überhaupt möglich.

- Die GUI-Performanz ist in vielen Fällen schlechter als bei Windows.

- Elektronische Annotationen sind nur selten möglich.

- Sehr selten stehen Tastatur-Shortcuts zur Verfügung.

- Web-Clients sind weniger konform zum Windows-Style-Guide, was höhere Trainingsaufwendungen nach sich zieht. Das gilt aber generell für Web-Anwendungen.

- Signifikant höherer Aufwand bei der Integration mit anderen Anwendungen (Indexübernahme, Rechercheintegration).

Darüber hinaus gibt es eine Reihe weiterer Funktionen, die für die Anwender als Ergänzung ihrer Archiv-Features immer wichtiger werden:

- Elektronischer Postkorb, um Dokumente direkt nach dem Posteingang zu scannen und aus einem digitalen Eingangskorb heraus zu bearbeiten (Voraussetzung für papierlose Prozesse). Einfache Postkorbkonstrukte sind mittlerweile Standard in zahlreichen DMS-Lösungen.

- Prozessintegration: Viele Dokumente sind Initiator oder wichtiger Bestandteil geschäftskritischer Prozesse. Daher entsteht vielfach der Wunsch, nicht nur einfach die Dokumentenabläufe, sondern die gesamte Geschäftslogik zu erneuern, wenn der Sprung von analogen zu digitalen Dokumenten vollzogen wird.

- Aktenverwaltung: Nicht nur die Verwaltung von Einzeldokumenten, sondern auch die Organisation von Aktenstrukturen inklusive Aktenplänen und die Übernahme beliebiger Dokumente in diese Akten sind für Ämter und Firmen wichtig und werden daher zunehmend über Standardfunktionen abgedeckt.

- Mandantenfähigkeit: Sie bietet die Möglichkeit, ein Lizenzsystem von mehreren Kunden nutzen zu lassen. Zudem umfasst sie Anforderungen wie getrennte Administrationsbereiche, Nummernkreise, Datenbanktabellen bis hin zu Statistiken für die nutzungsabhängige Abrechnung.

- Records Management: Dies bedeutet die Verwaltung aller relevanten Aufzeichnungen (Records), zu denen sämtliche Arten aufbewahrungspflichtiger Unterlagen aus unterschiedlichen Systemen gehören. Typische Anforderungen sind die Verwaltung von Aufbewahrungs- und Löschfristen und die damit verbundenen automatisierbaren Aufgaben für einen Archivverwalter.

- Dokumentenklassifikation/Indexextraktion: Die Personalkosten bei der Dokumentenerfassung sind hoch. Folgerichtig ist hier ein wachsender Markt für Produkte entstanden, die dem Anwender Arbeit abnehmen. Solche Software dient zur Dokumentenerkennung, Indexextraktion und eventuell sogar zur Durchreichung der Daten in die Hintergrundsysteme (beispielsweise Vorkontierung von Eingangsrechnungen, Vorerfassung von Anträgen).

- Individual- und Massensignaturen: Die stetige Verbreitung qualifiziert signierter Dokumente erfordert eine gesetzeskonforme Archivierung solcher Objekte. Dies bezieht sich nicht nur auf Schriftstücke, die bereits signiert empfangen werden (etwa Eingangsrechnungen gemäß Paragraf 14 Umsatzsteuergesetz, kurz UstG) sondern auch auf per Massensignatur unterzeichnete Dokumente am Scan-Arbeitsplatz. Neue Anforderungen entstehen hier sowohl in puncto Langzeitarchivierung (Aufbewahrungsfristen sind länger als die Zertifikatsgültigkeit, wodurch ein Nachsignieren erforderlich sein kann) als auch der Integration von Signaturlösungen in die Erfassungsprogramme bei eigensignierten Scan-Dokumenten, zum Beispiel gemäß Paragraf 36 der Allgemeinen Verwaltungsvorschrift über das Rechnungswesen in der Sozialversicherung, kurz SRvWV. (fn)