Fallstricke und Hilfen bei der Arbeit mit PDF/A

20.09.2007 von Thomas Zellmann
Nicht alle Tools können mit dem angehenden Standard für die Langzeitarchivierung PDF/A gut umgehen.

Auf einem Unternehmensserver sind zahllose Dateien in unterschiedlichen Formaten abgelegt. Briefe, Präsentationen, Tabellenkalkulationen oder auch CAD-Zeichnungen, die von Mitarbeitern erstellt oder per E-Mail eingegangen sind. Die langfristige Lesbarkeit dieser Dateien ist aufgrund der Versionssprünge und mangelnder Abwärtskompatibilität nicht gewährleistet. Statt sie in ihren Ursprungsformaten aufzubewahren, empfiehlt sich deshalb der Export in ein Archivformat wie PDF/A (siehe auch den Beitrag zur Entwicklung der diversen PDF-Standards und Strategie von Adobe). Dieser sollte aber erst dann erfolgen, wenn sich das Dokument nicht mehr ändert. Dies trifft beispielsweise auf Verträge zu, die Anwendern beispielsweise als Word-Datei so lange lokal vorhalten bis alle Änderungen eingearbeitet sind. Beim Umgang mit CAD-Zeichnungen empfiehlt es sich hingegen, zwei Format-Versionen vorzuhalten. Einmal als PDF/A für die sichere Langzeitarchivierung einer gebauten "Maschine" und einmal im CAD-Format, um diese weiter zu entwickeln.

Die Konvertierung von Office-Dateien, Zeichnungen in PDF/A oder eines herkömmlichen PDFs übernimmt typischerweise ein virtueller Druckertreiber. Dieser kann auf einem Client installiert sein, so dass die Anwender eigenständig die Dokumente als eine PDF/A-Datei drucken können, oder die Umwandlung erfolgt zentral auf einem Server. Anders als vielleicht vermutet ist aber besonders die Konvertierung von PDF-Dateien in PDF/A technisch schwierig. So muss eine PDF-Datei zunächst danach analysiert werden, ob ihre Inhalte nach dem PDF/A-Standard langfristig archivieren lassen. Dies geht manchmal nicht ohne manuellen Eingriff. Liegt zum Beispiel die Schriftart (Font) des Absenders nicht vor, kann er nicht eingebettet werden. Anwender sollten deshalb von Absendern, die eine PDF-Datei schicken wollen, diese gleich im PDF/A-Format anzufordern.

Ebenso ist es ein Problem, wenn eine signierte Rechnung nicht PDF/A-konform beim Empfänger ankommt. Sie muss dann technisch in PDF/A umgewandelt werden, was zum Bruch der Signatur führt. Grundsätzlich sieht der ISO-Standard zwar vor, dass eine PDF/A-Datei auch PDF/A-konform signiert werden kann. Aber noch nicht alle Signatur-Lösungen können dies nach heutigem Stand schon. Anwender sollten dies bei der Auswahl einer Signatur-Lösung diese Punkt unbedingt berücksichtigen.

Schnittstelle zwischen analoger und digitaler Welt

Neben elektronischen Dokumenten gelangen nach wie vor zahllose Papierdokumente ins Unternehmen oder schlummern in Aktenordnern, wo sie aufgrund gesetzlicher Regularien zehn Jahre und mehr aufzubewahren sind. Hier bietet PDF/A im Vergleich zum TIFF Vorteile durch kleinere Dateigrößen, Layout-Treue oder Volltextrecherchefähigkeit durch OCR. Recht unkompliziert gestaltet sich die Wandlung von Papierdokumenten in PDF/A-Dateien. Sie werden gescannt und anschließend ins PDF/A-Format exportiert.

PDF/A

PDF/A ist der angehende ISO-Standard für die Verwendung des PDF-Formats zur Langzeitarchivierung elektronischer Dokumente. Er beschreibt die Anforderungen an die Form elektronischer Dokumente, um deren Reproduzierbarkeit auch nach Jahrzehnten noch sicherstellen zu können. Mittlerweile existieren am Markt zahlreiche Softwarelösungen, die Anwender dazu verhelfen sollen, PDF/A-Dateien aus gescannten und elektronischen Dokumenten zu erzeugen, sie zu validieren und anzeigen zu lassen.

Mittlerweile sind am Markt zahlreiche "Scan-to-PDF/A"-Lösungen verfügbar. Ihr Spektrum reicht von einfachen Werkzeugen, die die Scans lediglich in einen PDF/A kompatiblen Rahmen einbetten, bis hin zu Lösungen, welche die Datei vorab mittels Layer-Technik auf kleine Dateigrößen komprimieren. Ebenso lassen sich ausgehende Dokumente in PDF/A aufbewahren. Eine wesentliche Anforderung ist hier aber, dass auch Post, die weiterhin klassisch per Brief versendet wird, als verlässliche elektronische Kopie archiviert werden kann. Eine Reihe verfügbaren Konvertern für Druckdatenströme unterstützt inzwischen die Ablage von Kopien als PDF/A.

PDF/A-Dateien erstellen, prüfen und anzeigen

Viele Anwender stehen beim Thema PDF/A noch am Anfang. Insbesondere Finanzdienstleister testen aktuell die Praxistauglichkeit des neuen Formats. Andere Unternehmen sollten PDF/A bei neuen Projekten im Dokumenten- oder Archivierungsbereich bei der Planung zumindest als Rahmenbedingung prüfen, zumal durch die angestrebte Standardisierung gut Chancen bestehen, dass PDF/A künftig eine breite Unterstützung im Markt erhält. Schon heute finden sich viele Produkte, die beim Aufbau eines einheitlichen elektronischen Archivs im PDF/A-Format helfen können (Eine Auswahl findet sich hier). Diese Tools lassen sich in Konverter, Validierer und Viewer unterscheiden:

Jeder PDF-Viewer, der PDF 1.4 unterstützt, kann PDF/A anzeigen, natürlich auch die Adobe Reader Versionen 5 und höher. Eine Detailfrage ist, ob er sie PDF/A konform anzeigt. Nutzt der Viewer beispielsweise wirklich den eingebetteten Schriftfont oder den des eigenen Arbeitsplatzes? Entscheidender bei der Auswahl sind aber die Produkteigenschaften wie beispielsweise die Anzeigegeschwindigkeit und Bedienbarkeit für Endanwender.

Natürlich beinhaltet "Acrobat Professional" von Adobe die Möglichkeit, PDF/A-Dateien zu erstellen. Es gibt jedoch zahlreiche weitere Werkzeuge, die zum Teil funktional und preislich besser sind. Die Produktauswahl ist im Wesentlichen davon abhängig, ob der Anwender eher eine programmierbare und damit anpassbare PDF-Library oder ein "ready-to use"-Endbenutzerwerkzeug benötigt.

Hier gibt es mittlerweile zahlreiche Produkte. Sie unterscheiden sich vor allem darin, ob sie alle Dokumentenarten in eine PDF/A-Datei konvertieren können oder nur spezielle Dateiformate. Die Auswahl hängt stark von dem Einsatzgebiet ab und welche Arten von Dokumenten nach PDF/A konvertiert werden sollen. Zum Beispiel kann die Konvertierung nach PDF/A auch in einem Migrations-Projekt miterledigt werden. Auch "Microsoft Office 2007" unterstützt die Umwandlung nach PDF/A, und das ist ein weiterer Hinweis für die Wichtigkeit des PDF/A-Standards.

Ein PDF/A-Validator prüft, ob eine PDF-Datei wirklich dem ISO-Standard entspricht und sitzt typischerweise als "Wächter" vor dem Archivsystem. Die verfügbaren Produkte unterscheiden sich grob darin, wie ausführlich sie prüfen. Sie sind als Desktop-, Command-Line-Tool oder Software Development Kit erhältlich. Der Einsatz eines Validiers ist aber nicht gleich zwingend notwendig, beispielsweise, wenn in einer gesicherter Umgebung ausschließlich der Posteingang digitalisiert und mit einem Produkt nach PDF/A konvertiert wird. Sind aber PDF/A Dateien aus verschiedenen Anwendungen und insbesondere von externen Quellen zu archivieren, ist der Einsatz eines Validierers sinnvoll. Einige DMS-Lieferanten bieten bereits Module zur Prüfung der PDF/A-Dateien an. Wer ganz sicher gehen möchte, verwendet mehrere Validierer und nutzt sie wie von OCR-Lösungen bekannt im Voting-Verfahren. Weitere Informationen zu PDF/A finden Sie zum Beispiel auf der Website des "PDF/A Competence Centers". Ferner hat die Computerwoche eine Reihe nützlicher Tools für die Arbeit mit PDF auf ihrem Wiki zusammengestellt. (as)