Fallstricke bei der Arbeit mit PDF/A

25.10.2007
Nicht alle Tools können mit dem angehenden Standard für die Langzeitarchivierung gut umgehen.
Dank diverser Tools können heute Dokumente automatisiert als PDF/A angezeigt, erstellt und validiert werden.
Dank diverser Tools können heute Dokumente automatisiert als PDF/A angezeigt, erstellt und validiert werden.

Auf einem UnternehmensServer sind zahllose Dateien in unterschiedlichen Formaten abgelegt, unter anderem Briefe, Präsentationen, Tabellenkalkulationen oder auch CAD-Zeichnungen, die von Mitarbeitern erstellt oder per E-Mail eingegangen sind. Die langfristige Lesbarkeit dieser Dateien ist aufgrund der Versionssprünge und mangelnder Abwärtskompatibilität nicht gewährleistet. Statt sie in ihren Ursprungsformaten aufzubewahren, empfiehlt sich deshalb der Export in ein Archivformat wie PDF/A. Dieser sollte aber erst dann erfolgen, wenn sich das Dokument nicht mehr ändert. Das trifft beispielsweise auf Verträge zu, die Anwender so lange als Word-Datei lokal vorhalten, bis alle Änderungen eingearbeitet sind. Hingegen empfiehlt es sich, CAD-Zeichnungen in zwei Format-Versionen zu speichern: einmal als PDF/A für die sichere Langzeitarchivierung einer gebauten "Maschine" und einmal im CAD-Format, um sie weiterzuentwickeln.

Standardisierung

Basierend auf Adobes Spezi-fikationen zu PDF 1.4 soll PDF/A ein einheitliches Format zur Langzeitarchivierung elektronischer Dokumente liefern. Seit 2005 ist eine Version unter der Bezeichnung PDF/A-1 als ISO-Standard veröf-fentlicht. Da diese noch Einschränkungen aufweist, arbeitet die ISO derzeit mit PDF/A-2 an einem zweiten Normteil, der sich die Spezifikationen von PDF 1.5, 1.6 und 1.7 zunutze machen soll. Eine Ver-öffentlichung ist für 2009 angepeilt.

Warum PDF/A?

Der Archivierungsstandard verspricht

folgende Vorteile:

PDF/A speichert Objekte wie Textzeichen und Grafiken. Damit lässt sich der volle Text im ganzen Archiv effizient durchsuchen. Ein Tiff-Dokument ist ein Rasterbild und muss daher zuerst mittels OCR gescannt werden.

PDF/A-Dateien belegen im Vergleich zur Originaldatei- oder einer vergleichbaren Tiff-Datei einen wesentlich geringeren Speicherplatz, ohne an Qualität zu verlieren. Dies wirkt sich bei der elektronischen Übermittlung von Dokumenten per FTP oder als Anlage zur E-Mail positiv aus.

Das PDF/A-Format ist je nach Verwendungszweck optimierbar. Tiff macht hier keine Unterschiede.

Metadaten wie Titel, Autor, Erstellungsdatum, Änderungsdatum, Thema, Schlüsselwörter lassen sich als Teil einer PDF/A-Datei speichern. Durch diese können PDF-Dateien automatisch klassifiziert werden.

Hier lesen Sie ...

worauf bei der Umwandlung in das Archivformat PDF/A zu achten ist;

wie Werkzeuge heute die Arbeit mit Dokumenten unterstützen können.

Konvertierung mit Tücken

Die Konvertierung von Office-Dateien und Zeichnungen in PDF/A oder ein herkömmliches PDF übernimmt typischerweise ein virtueller Druckertreiber. Dieser kann auf einem Client installiert sein, so dass die Anwender eigenständig die Dokumente als PDF/A-Datei drucken können, oder die Umwandlung erfolgt zentral auf einem Server. Anders als vielleicht vermutet ist aber besonders die Konvertierung von PDF-Dateien in PDF/A technisch schwierig. So muss eine PDF-Datei zunächst danach analysiert werden, ob sich ihre Inhalte nach dem PDF/A-Standard langfristig archivieren lassen. Dies geht manchmal nicht ohne manuellen Eingriff. Liegt zum Beispiel die Schriftart (Font) des Absenders nicht vor, kann er nicht eingebettet werden. Anwender sollten deshalb von Absendern, die eine PDF-Datei schicken wollen, diese gleich im PDF/A-Format anfordern.

Ebenso ist es ein Problem, wenn eine signierte Rechnung nicht PDF/A-konform beim Empfänger ankommt. Sie muss dann technisch in PDF/A umgewandelt werden, was zum Bruch der Signatur führt. Grundsätzlich sieht der ISO-Standard zwar vor, dass eine PDF/A-Datei auch PDF/A-konform signiert werden kann. Aber nicht alle Signatur-lösungen schaffen dies nach heutigem Stand schon. Anwender sollten dies bei der Produktauswahl unbedingt berücksichtigen.

einige Vorteile (siehe Kasten "Warum PDF/A?"). Ebenso ist die Wandlung von Papierdokumenten in PDF/A-Dateien unkompliziert. Sie werden gescannt und anschließend ins PDF/A-Format exportiert.

Umgang mit Papierdokumenten

Mittlerweile sind diverse "Scan-to-PDF/A"-Lösungen verfügbar. Ihr Spektrum reicht von einfachen Werkzeugen, die die Scans lediglich in einen PDF/A kompatiblen Rahmen einbet-ten, bis hin zu Lösungen, welche die Datei vorab mittels Layer-Technik auf kleine Dateigrößen komprimieren. Ebenso lassen sich ausgehende Dokumente in PDF/A aufbewahren. Eine wesentliche Anforderung ist hier aber, dass auch Post, die weiterhin klassisch per Brief versendet wird, als verlässliche elektronische Kopie archiviert werden kann. Einige Konverter für Druckdatenströme unterstützen inzwischen die Ablage von Kopien als PDF/A.

Anwender zögern noch

Viele Anwender stehen beim Thema PDF/A noch am Anfang. Insbesondere Finanzdienstleister testen die Praxistauglichkeit des neuen Formats. Andere Unternehmen sollten PDF/A, wenn sie Projekte im Dokumenten- oder Archivierungsbereich planen, zumindest als Rahmenbedingung prüfen, zumal durch die Standardisierung gute Chancen auf eine breite Unterstützung für PDF/A bestehen. Unternehmen können heute schon bei den Tools zwischen Konvertern, Validierern und Viewern wählen, die beim Aufbau eines einheitlichen elektronischen Archivs im PDF/A-Format helfen können:

PDF/A-Dokumente anzeigen:

Jeder PDF-Viewer, der PDF 1.4 unterstützt, kann PDF/A anzeigen. Eine Detailfrage ist, ob ein Viewer die Daten PDF/A-konform anzeigt. Nutzt das Tool beispielsweise wirklich den eingebetteten Schriftfont oder den des eigenen Arbeitsplatzes? Wichtiger für die Auswahl sind aber andere Produkteigenschaf-ten wie die Anzeigegeschwindigkeit und Bedienerfreundlichkeit.

PDF/A-Dokumente erstellen:

Natürlich beinhaltet "Acrobat Professional" von Adobe die Möglichkeit, PDF/A-Dateien zu erstellen. Es gibt jedoch zahlreiche weitere Werkzeuge, die zum Teil funktional und preislich besser sind. Die Produktauswahl ist im Wesentlichen davon abhängig, ob der Anwender eher eine programmierbare und damit anpassbare PDF-Library oder ein "Ready-to use"-Endbenutzerwerkzeug benötigt.

In ein PDF/A-Dokument konvertieren:

Auch hier sind mittlerweile viele Produkte verfügbar. Sie unterscheiden sich vor allem darin, ob sie alle Dokumentenarten in eine PDF/A-Datei konvertieren können oder nur spezielle Dateiformate. Die Auswahl hängt stark von dem Einsatzgebiet ab und welche Arten von Dokumenten nach PDF/A konvertiert werden sollen. Zum Beispiel kann die Konvertierung nach PDF/A auch in einem Migrationsprojekt miterledigt werden. Auch "Microsoft Office 2007" unterstützt die Umwandlung nach PDF/A, und das ist ein weiterer Hinweis für die Wichtigkeit des PDF/A-Standards.

PDF/A-Dokumente validieren:

Ein PDF/A-Validierer prüft, ob eine PDF-Datei dem ISO-Standard entspricht, und sitzt als "Wächter" vor dem Archivsystem. Die verfügbaren Produkte unterscheiden sich darin, wie ausführlich sie prüfen. Sie sind als Desktop-, Command-Line-Tool oder Software Development Kit erhältlich. Der Einsatz eines Validierers ist aber nicht immer notwendig, beispielsweise dann nicht, wenn in einer gesicherten Umgebung ausschließlich der Posteingang digitalisiert und mit einem Produkt nach PDF/A konvertiert wird. Sind aber PDF/A-Dateien aus verschiedenen Anwendungen und insbesondere von externen Quellen zu archivieren, ist der Einsatz eines Validierers sinnvoll. Einige Hersteller von Dokumenten-Management-Systemen (DMS) bieten bereits Module zur Prüfung der PDF/A-Dateien an. Wer ganz sichergehen möchte, verwendet mehrere Validierer und nutzt sie wie von OCR-Lösungen (Optical Character Recoguition) bekannt im Voting-Verfahren. (as)

*Thomas Zellmann ist Vorstandsvorsitzender des PDF/A Competence Centers.