Austausch von Schriftstücken in heterogenen Rechnerwelten

ODA/ODIF und SGML geben MHS-Dokumenten ein Gesicht

30.03.1990

Mit den noch verhältnismäßig neuen Dokumentenstandards ODA/ODIF und SGML (Standard Generalized Markup Language) können Bürokommunikations-Anwender ihren Dokumenten einen einheitlichen Schliff auf der Sende- und Empfangsseite verpassen. ODA/ODIF erstreckt sich dabei in seiner Funktionalität, wie in Teil 1 des Artikels beschrieben, auch auf den Layout-Bereich.

Büroarbeit zeichnet sich durch einen hohen Anteil an interner, aber auch externer Kommunikation aus. Große Bedeutung kommt dabei bisher der papiergebundenen Kommunikation zu. Durch moderne Textverarbeitung daran gewöhnt, den Text elektronisch zur Verfügung zu haben, kommt es gleichermaßen einem Rückschritt gleich, wenn dieser nicht so übertragen werden kann, daß er beim Empfänger in gleicher Weise elektronisch verfügbar ist. Das ist vor allem dann der Fall, wenn Sender und Empfänger nicht die gleiche Hard- und Software zur Be- und Verarbeitung ihrer Dokumente benutzen. Ein Austausch in solchen, als offen bezeichneten Systemen ist dann nur möglich, wenn man Absprachen über die verwendete Kommunikationsart, die entsprechenden Protokolle und die verbindenden Leitungen getroffen hat oder sich der Kommunikationsdienste Teletex und Telex bedient.

Diese Absprachen betreffen zum einen das Dokument und zum anderen die Versendungsform. Ein elektronisches Dokument besteht-wie jedes papiergebundene Dokument- , wenn es gesendet wird, aus dem Dokument selbst und einem "Umschlag" mit Absender-/Empfängerangaben und besonderenHinweisen zur Versendungsform.

Wichtig ist dabei, daß zwischen den Kommunikationspartnern ein gemeinsames Verständnis über die Bedeutung der zu übermittelnden Informationen herrscht. Internationale Standardisierungsgremien, wie die ECMA (European Computer Manufacturers Association) und die ISO (International Standardisation Organisation), haben sich mit diesen Problemen befaßt und Standards entwickelt, die eine Kommunikation in offenen Systemen ermöglichen.

Message Handling Systeme umfassen alle Aufgaben, die mit der Versendung von Dokumen-

ten durch Electronic Mail zu tun haben. Das CCITT (comite consultatif international telegraphique et telephonique) und die ISO haben Empfehlungen für den Austausch von Dokumenten in offenen Systemen herausgegeben.

`Die bekanntesten dieser Standards sind X. 400ff. Sie beinhalten im wesentlichen zwei Arten von Informationen.

Das sind zum einen Informationen, die sich unter anderem mit Routing, Timing, dem Handling von mehreren oder alternativen Empfängern, Empfangsbestätigungen und Prioritäten befassen, und zum anderen Informationen, die sich mit dem Dokument selbst befassen. Darunter versteht man vor allem Verfügungsberechtigungen, Dringlichkeit und Aktualität des Dokumentes sowie Bezugnahmen auf andere Dokumente. X. 409 entspricht in seiner Definition dem Übertragungsstandard ODIF.

In ODIF werden die wesentlichen Bestandteile eines Dokumentes in Datenstrukturen dargestellt.

Message Handling Systeme und Absprachen bezüglich der Versendungsform reichen jedoch keineswegs aus, um Texte zwischen verschiedenen Anwendungssystemen austauschen zu können. Dies liegt darin begründet, daß jedes Textverarbeitungssystem seine eigenen Steuerzeichen zur Formatierung und Gestaltung der Dokumente benutzt. Noch problematischer wird es, wenn ein Dokument außer Text noch andere Elemente, wie Grafiken und Tabellen, enthält. Wird ein solches Dokument elektronisch weitergegeben und der Empfänger verfügt nicht über die gleiche Hard- und Software, so gehen wichtige Informationen aus dem und über das Dokument verloren, denn der Empfängereditor versteht die Steuerzeichen des Editors auf der Absenderseite in der Regel nicht. Das ist etwa so, als wenn jemand, der der chinesischen Sprache nicht mächtig ist, einen Brief in chinesischen Schriftzeichen geschrieben erhält. Wichtige Darstellungsmittel zur Strukturierung von Dokumenten, wie Einrückungen oder Hervorhebungen wichtiger Stellen, werden vom Empfängereditor nicht oder falsch verstanden. Übrig bleibt meist ein Dokument, das einer umfassenden Nachbereitung bedarf.

Mehraufwand ohne Wertschöpfung

In jedem Fall entsteht so ein Mehraufwand ohne Wertschöpfung. Diese Problematik wird dadurch verstärkt, daß selbst innerhalb eines Unternehmens die Notwendigkeit der Kommunikation zwischen unterschiedlichen Rechner- und Anwendungssystemen immer mehr zunimmt. Insbesondere Fusionen zwingen dazu, eine heterogene Computerlandschaft im eigenen Unternehmen zu berücksichtigen. Eine Lösung dieser Problematik versprechen die beiden Dokumentenstrukturierungsstandards ODA-ODIF (Office Document Architecture/Office Document Interchange Format) und SGML, die im folgenden vorgestellt und miteinander verglichen werden.

ODA ist wohl der im Bürobereich bekanntere der beiden Standards für die Beschreibung von Dokumenten. Das Gesamtmodell besteht aus verschiedenen Teilen. Der gegnerische Teil erlaubt es, Dokumentenklassen gemäß Standard zu definieren. In einem spezifischen Teil wird das konkrete Dokument dieser Klasse beschrieben. Ferner unterscheidet der Standard zwischen einer logischen und einer Layout-Struktur. Die logische Struktur gibt an, aus welchen Bausteinen ein Dokument zusammengesetzt ist, während die Layout-Struktur die Anordnung der Elemente auf dem Ausgabemedium, zum Beispiel Papier, festlegt. Der Inhalt des Dokumentes wird in Inhaltsstücke zerlegt und den entsprechenden logischen und Layout-Elementen zugeordnet. Außer diesen Teilen kann es noch einen Vorspann (profile) geben, der Attribute zur generellen Beschreibung eines Dokumentes, wie Seitenzahl und Verwaltungsinformationen, enthält. Ein solchermaßen nach ODA aufgebautes Dokument läßt sich nun auf der Seite des Empfängers direkt weiterverarbeiten.

ODA ist hierarchisch in einer Baumstruktur aufgebaut. Auf der untersten Ebene, der Blattebene, befinden sich die Basisobjekte, die gemäß einer Inhaltsarchitektur strukturiert sind. Diese Inhaltsarchitek- turen können Zeichenarchitekturen, wie Teletex, sein. Die Basisobjekte werden durch Konstruktoren,

wie beispielsweise List-Konstruktoren, zusammengesetzt. Die Bäume, die auf diese Weise entstehen, beschreiben das Dokument oder auch bestimmte Dokumentenbestandteile, wie Paragraphen oder Kapitel, nun aus logischer und aus Layout-Sicht.

Zwischen den einzelnen Objekten gibt es Relationen, zum Beispiel zwischen Referenzen und Fußnoten oder zwischen Überschriften und dem dafür vorgesehenen Layout.

ODA-Dokumente können in formatierter oder in verarbeitbarer Form ausgetauscht werden. Als Austauschformat liegt ODIF zugrunde.

Zu den wichtigsten Merkmalen des Standards zählen:

-ODA-Dokumente sind ausschließlich maschinenlesbar. Zu ihrer Interpretation benötigt man spezielle Formatierer oder man muß die Semantik der Layout-Beschreibung auf eine Formatiersprache abbilden.

-ODA-Dokumente (damit sind die ISO-Normen für Zeichensätze, Rastergrafik und geometrische Grafik gemeint) können nur die im Standard vorgesehenen Inhalte verwenden, ODA läßt nur bestimmte Attribute zu. Attribute geben Eigenschaften von Dokumenten an. ODA schreibt hier ziemlich genau vor, welche Eigenschaften ein Dokument als Ganzes haben kann, wie ein Dokument dargestellt werden kann und welche Angaben für die Dokumentenverwaltung möglich sind. Beispiele können sein: Titel eines Dokumentes, Schlüsselworte Verfalldaten, zugelassene Zeichensätze und vieles mehr.

-ODA ist in seiner Funktionalität stark eingeschränkt, kann aber zwischen beliebigen Kommunikationspartnern ausgetauscht werden.

(wird fortgesetzt)