Forum

PDF/A für Langzeitarchive?

08.07.2010
Von 
Diplomkaufmann Frank Zscheile ist Freier Journalist in München-Westend.

PDF/A auch für gescannte Dokumente?

Jürgen Biffar, Docuware: Für gescannte Dokumente reicht PDF, für computererzeugte empfiehlt sich PDF/A.
Jürgen Biffar, Docuware: Für gescannte Dokumente reicht PDF, für computererzeugte empfiehlt sich PDF/A.

Doch wann ist es überhaupt sinnvoll, Dokumente oder E-Mails samt Attachments in PDF/A zu archivieren? Kann es sogar schädlich sein? Dies wollte Bernhard Zöller von den Diskussionsteilnehmern wissen. Jürgen Biffar, Vorstand der Docuware AG, betrachtet das Format für gescannte Dokumente als überflüssig. Es bringe keine Vorteile: "PDF/A wurde definiert, um sicherzustellen, dass sämtliche Zusatzinformationen, die zur präzisen Darstellung erforderlich sind, zum Beispiel alle verwendeten Schriftarten, in die Datei eingebettet sind. Bei gescannten Dokumenten gibt es aber keine derartigen Zusatzinformationen. Man darf nicht vergessen, dass die Erzeugung von PDF/A-Dokumenten mehr Aufwand bedeutet und bestimmte Techniken erfordert." Der Trend gehe dahin, immer mehr farbige Dokumente zu scannen und dafür PDF zu wählen. Biffar weiter: "Man hat bisher primär JPGs erzeugt, was aber in der Handhabung komplizierter war, weil man pro Seite eine Datei hat. Heute kann man bequem aus farbig gescannten Dokumenten normale PDFs erzeugen, die eine vernünftige Größe haben und alle Anforderungen an die Langzeitarchivierung erfüllen." Als Format für die Langzeitarchivierung von computererzeugten Dokumenten befürwortet Biffar jedoch PDF/A.

Die Entscheidung liegt beim Anwender

Karl-Heinz Mosbach, ELO Digital Office: Wer sichergehen will, dass sein Dokument auch nach zehn Jahren noch lesbar ist, sollte sich aufgrund von Spezifikationen wie der Font-Einbettung für PDF/A entscheiden.
Karl-Heinz Mosbach, ELO Digital Office: Wer sichergehen will, dass sein Dokument auch nach zehn Jahren noch lesbar ist, sollte sich aufgrund von Spezifikationen wie der Font-Einbettung für PDF/A entscheiden.

ECM-Hersteller überlassen ihren Kunden daher die Wahl des Formats. Bei ELO können Benutzer standardmäßig entscheiden, ob sie im PDF/A-Format archivieren möchten oder nicht. "Eine reine Einstellungssache", so Karl-Heinz Mosbach, Geschäftsführer der ELO Digital Office GmbH. Seine Beobachtung: Unternehmen, die Compliance-orientiert denken, entscheiden sich für PDF/A. Dies empfiehlt der ELO-Chef auch seinen Kunden und stellt gleichwohl fest, dass die Mehrzahl noch immer Standard-PDFs archiviert, weil Langzeitaufbewahrung kein drängendes Thema für sie ist.

PDF/A also nur dort, wo es wirklich sinnvoll ist? "Für Dokumente, die nicht langzeitarchiviert werden müssen, reicht das normale PDF teilweise aus", erklärt Mosbach. Wer aber sichergehen will, dass sein Dokument auch nach zehn Jahren noch lesbar ist, sollte sich aufgrund von Spezifikationen wie der Font-Einbettung für PDF/A entscheiden. Dass die Dateien durch die enthaltenen Fonts zu groß sind, sei ein unzutreffendes Gerücht, erklärt Harald Grumser: "Eine einseitige Schwarzweiß-Datei umfasst als Tagged Image File Format (Tiff) rund 70 KB, als PDF/A ist sie nur unwesentlich größer. Die Frage stellt sich außerdem angesichts der immer geringeren Preise für Speicherplatz nicht mehr."

Einheitliches Format - leichte Migration

Carsten Heiermann, Luratech, rät Anwendern, beim Archivformat keinen Unterschied zwischen gescannten oder elektronisch erzeugten Dokumenten zu machen und empfiehlt eine Formatvereinheitlichung auf Basis von PDF/A.
Carsten Heiermann, Luratech, rät Anwendern, beim Archivformat keinen Unterschied zwischen gescannten oder elektronisch erzeugten Dokumenten zu machen und empfiehlt eine Formatvereinheitlichung auf Basis von PDF/A.

Unterschiedliche Formate für die Archivierung also, je nach Art des Dokuments? Eine Strategie, vor der es PDF/A-Verfechtern wie Carsten Heiermann graust: "Die Idee hinter dem Ganzen ist doch eine Formatvereinheitlichung im elektronischen Archiv", argumentiert er. "Spätestens wenn eine Migration ansteht, wird es mit vielen unterschiedlichen Formaten zu kompliziert. Man kann nicht bei jeder Datei klären, ob sie noch einmal zehn Jahre in der jetzigen Form aufbewahrt werden kann." Er rät Anwendern daher, beim Archivformat keinen Unterschied zwischen gescannten oder elektronisch erzeugten, farbigen oder schwarzweißen Dokumenten zu machen. "PDF/A ist ein normierter Container, von dem man nicht explizit abweichen muss, wenn sich kein signifikanter Nachteil daraus ergibt."

Neben der Volltext-Durchsuchbarkeit liegt der Vorteil des Formats vor allem darin, dass es sich für alle Dokumentenarten nutzen lässt, und das ist gut, wenn etwa ein Dokument aus gemischten Inhalten erstellt werden soll, zum Beispiel aus elektronisch erzeugten und gescannten Dokumenten. Laut Heiermann gibt es daher kaum Gründe, an den alten Techniken festzuhalten.