Bürodokumentarchitektur (Teil 1):

Standard ECMA 101 und Stand der Normung

11.04.1986

Dokumente sind ein wesentlicher Bestandteil der Büroinformation. Zum Austausch von Dokumenten in elektronischer Form zwischen Systemen verschiedener Hersteller sind genormte Austauschformate nötig. Dabei soll es für den Empfänger möglich sein, das Dokument originalgetreu zweidimensional zu reproduzieren und/oder es weiter zu bearbeiten. In den internationalen Standardisierungsgremien wurde ein Dokumentarchitektur-Modell entwickelt und davon wurde eine Familie von Dokumentaustauschformaten abgeleitet. Beides wurde als ein erster Standard im Juni 1985 von der ECMA verabschiedet. Andere Gremien, wie ISO, DIN und CCITT, entwickeln den Standard innerhalb der abgesegneten Rahmenbedingungen weiter.

Redigieren und Formatieren eines Dokuments sind kompliziertere Vorgänge als die bloße Wiedergabe. Des halb wurde die Entwicklung des Dokumentarchitektur-Modells durch die Forderung leichter Bearbeitbarkeit geprägt (Krö 84, Hor 83). Systeme zur Be- und Verarbeitung von Dokumenten haben ihre eigenen internen Datenstrukturen für Dokumente. Diese sind bestimmt durch die Operationen, die auf ihnen ausgeführt werden. Zur Übertragung von Dokumenten müssen diese internen Datenstrukturen in Austauschformate konvertiert werden (Bild 1). Diese Konversionen sollten im idealen Fall ohne Informationsverluste möglich sein. Dies ist dann gewährleistet, wenn sowohl die Datenstrukturen wie auch die Austauschformate vom gleichen Dokumentarchitektur-Modell abgeleitet werden. Der aktuelle Stand des Dokumentarchitektur-Modells (Hor 34, Hor 84a), das heißt, der bereits weiterentwickelte Standard ECMA 101, ist in dieser Folge beschrieben. Die davon abgeleiteten Dokumentaustauschformate (Hor 85) werden in der übernächsten Folge betrachtet.

Aufbau von Dokumenten

Betrachtet man ein Dokument so kann man zwei Strukturen erkennen: Die Layoutstruktur beschreibt, wie der Inhalt eines Dokuments, das heißt der Text und die Bilder, bei der Wiedergabe zweidimensional auf Seiten anzuordnen sind. Die logische Struktur untergliedert ein Dokument in Kapitel, Unterkapitel, Überschriften, Fußnoten und so weiter. Sie ist unabhängig vom Layout des Dokuments. In der Modellvorstellung wird jede der beiden Strukturen durch eine Hierarchie von Objekten ausgedrückt. Jedes solche Objekt ist von einem bestimmten Objekttyp. Für den Aufbau der logischen Struktur stellt das Dokumentarchitektur-Modell ODA (Office Document Architecture) folgende Objekttypen zur Verfügung:

- Document Logical Root. Ein solches Objekt ist die oberste Stufe in der logischen Struktur beziehungsweise es kann als die Wurzel des logischen Strukturbaumes betrachtet werden.

- Basic Logical Object. Diese logischen Objekte sind auf der untersten Ebene der Hierarchie beziehungsweise es sind die Blätter des Strukturbaumes. Sie enthalten Inhaltsportionen des Dokuments, wie Text oder Bilder.

- Composite Logical Objects. Aus solchen Objekten können beliebig viele Hierarchie-Ebenen zwischen der Document Logical Root und den Basic Logical Objects aufgebaut werden. Sie haben jedoch direkt keinen Inhalt, wie auch das Beispiel in Bild 3 zeigt.

Für die Layoutstruktur stellt ODA folgende Objekttypen bereit:

- Document Layout Root. Ein solches Objekt ist die oberste Stufe in der Layoutstruktur beziehungsweise es kann als die Wurzel des Layout-Strukturbaumes betrachtet werden.

- Page Set. Eine Gruppe von Seiten kann in einem Objekt vom Typ Page Set zusammengefaßt werden.

- Page. Ein Objekt vom Typ Page ist ein zweidimensionaler Bereich, auf dem der Inhalt des Dokuments positioniert und dargestellt wird.

- Frame. Ein Objekt vom Typ Frame beschreibt einen rechteckigen Bereich auf einer Seite, in den der Inhalt während der Layoutgestaltung formatiert werden kann. Außerhalb von Frames darf im allgemeinen kein Inhalt auf Seiten dargestellt werden.

- Block. Blöcke entstehen beim Einfüllen des Inhalts in einen Frame. Der Inhalt eines Blocks kann nur von einer Art sein, zum Beispiel nur Text oder nur Grafik. Blöcke sind die einzigen Layoutobjekte, die direkt Inhalt enthalten.

*Die Autoren sind Siemens-Mitarbeiter in München. Literaturhinweis in der nächsten Folge

ODA kontra DIA

Das Kürzel ODA = Office Document Architecture wird die künftige Diskussion auch bei Anwendern der Bürokommunikationsszene beherrschen. Das Dokument ist ein zentraler Gegenstand aller Bürosysteme und orientiert sich zur Zeit noch oft an den entsprechenden "Normen" des Marktführers, also an DIA/DCA aus der Büroarchitektur der IBM, genannt Dissos. Die großen Standardisierungsgremien arbeiten an der offenen Alternative ECMA 101. Sie ist in dieser Folge der mehrteiligen CW-Serie "Bürodokumentarchitektur" beschrieben. Die von ECMA 101 abgeleiteten Dokumentaustauschformate werden später beschrieben.