Informationen werden zu komplexen Datenstrukturen

Die Dokumentenverarbeitung löst die Datenverarbeitung ab

22.06.1990

Der Einsatz innovativer Techniken und Produkte entscheidet zunehmend über Wettbewerbsvorteile. Allerdings fordern sie einen hohen Dokumentationsaufwand während der Entwicklung und hohen Erklärungsbedarf für den Endnutzer. Die Probleme einer umfassenden Dokumentenverwaltung sind also vielfältig.

Unternehmen, die komplexe Produkte mit teilweise kurzen Innovationszyklen fertigen, entwickeln sich heute auf Grund ihres hohen Dokumentationsbedarfs oft zu "Papier-verarbeitenden" Betrieben. Hierzu zählt sicher in hohem Maße die gesamte Computer-lndustrie.

Komplexe Anforderungen

Speziell in Branchen, die zusätzlich hohe sicherheitstechnische Auflagen zu erfüllen haben, wie etwa im Flugzeugbau oder in der chemischen und Pharma-lndustrie, hat der Umfang der zu erstellenden Dokumente eine Größenordnung angenommen, die nur noch durch den verstärkten Einsatz intelligenter Werkzeuge und Methoden beherrschbar ist. Entsprechend komplex sind die Anforderungen an eine unternehmensweite integrierte Dokumentenverarbeitung:

- Dokumente sollen beispielsweise im Team bausteinweise bearbeitet werden können. Dabei sind verschiedene Versionen und Varianten des Dokumentes zu verwalten und zusätzlich auch noch fremdsprachige Versionen zu berücksichtigen.

- Dokumente benötigen die Text-, Bild- und Grafikintegration.

- Dokumente und Informationsbausteine sollen annotiert, daß heißt, mit Anmerkungen und Kommentaren versehen werden können.

- Die einzelnen Informationsbausteine sollen auf verschiedenen Anwendungssystemen erzeugt und bearbeitet werden können.

- Die Anwendungssysteme greifen auf heterogene Rechnerwelten, wie PCs, Macintoshs, Workstations und Mainframes zurück, die vernetzt sein müssen.

- Dokumente und Informationsbausteine sollen zwischen heterogenen Anwendungen und Rechnersystemen austauschbar sein.

- Die zu bearbeitenden Dokumente sind keine 10-Seiten-Papiere, sondern haben einen Umfang von einigen tausend Seiten, im Extremfall aber auch hunderttausend Seiten Umfang.

- Die zentrale Verwaltung und Archivierung von Dokumenten im Bereich von einigen hundert GB sind notwendig.

- Gleichzeitig wird aber auch eine effektive Volltextsuche gewünscht.

Natürlich stellen nicht alle Unternehmen heute diese extremen Anforderungen an eine Dokumentenverarbeitung. Jedes Unternehmen aber, das sich mit der Einführung einer unternehmensweiten integrierten Dokumentenverarbeitung befaßt hat, wird mit einer Reihe der oben genannten Anforderungen in unterschiedlicher Wertigkeit konfrontiert worden sein.

Um welche Klassen von Dokumenten geht es, wenn man sich mit Dokumentenverarbeitung beschäftigt? Es sind sicher verschiedene Dokumententypen zu unterscheiden, die eine unterschiedliche Verarbeitungsweise erfordern, wie etwa:

- Geschäftsbrief,

- Handelsdaten (Bestellung, Lieferschein, Rechnung)

- Konstruktionsunterlagen (2D- und 3D-Plots, Strichzeichnungen, farbige, schattierte 3D-Darstellungen),

- Fertigungsunterlagen (Stücklisten, Arbeitspläne etc.),

- technische Dokumentation, "Compound Documents" (Benutzerhandbücher, Forschungsberichte, Programm-Dokumentationen, Wartungs- und Installationshandbücher) - Zeitschriften, Magazine, Kataloge,

- Schulungsunterlagen und Informationssysteme.

Diese verschiedenen Dokumententypen erfordern auch unterschiedliche Werkzeuge um jeweils kostengünstig Dokumente zu erstellen. Der Wunsch nach einem Universalwerkzeug für alle Bereiche und Anforderungen der Dokumentenverarbeitung, welches dann viele Probleme der Dokumentenkonvertierung und der Inkompatibilitäten heterogener Systeme beseitigt, ist verständlich, aber letztlich nicht auf ökonomisch sinnvolle Art realisierbar.

So wenig es sinnvoll ist, sich ein 100-MIPS-Parallelrechnersystem für die häusliche Überprüfung der Stromrechnung anzuschaffen, kann es Sinn machen, jeden einfachen Geschäftsbrief im Unternehmen auf einem High-end-Publishing-System in Fotosatzqualität zu setzen. Der Weg muß vielmehr dahin gehen, für verschiedene Aufgabenbereiche auch in Zukunft unterschiedlich mächtige Werkzeuge mit angemessenem Preis-Leistungs-Verhältnis einzusetzen, die dann auch differenzierte qualitative Anforderungen an die jeweilige Benutzergruppe stellen und somit eine ökonomisch sinnvolle Dokumenten-verarbeitung ermöglichen.

Heute sind Dokumente immer als Compound Documents zu betrachten, die Text, Bild und Grafik in mehr oder weniger hoher typografischer Qualität integrieren. In Zukunft wird die zusätzliche Integration von Video- und Sprachdaten Multimedia-Dokumente ermöglichen, die zu neuen Anwendungsmöglichkeiten bei Informationssystemen und bei der Schulung führen. Man kommt damit zu einem völlig neuen Dokumentenbegriff, der sich loslösen muß von der Vorstellung, daß Dokumente zwangsläufig mit dem Medium Papier zu tun haben, also etwas Statisches sind.

Die Livelink-Möglichkeiten moderner Publishing-Systeme ermöglichen dynamische Dokumente, die im Extremfall nahezu ausschließlich aus Verweisen auf Informationsbau-steine bestehen können. Derartige Dokumente machen den Weg frei für eine dynamische Aktualisierung des gesamten Dokumentes durch ständiges Aktualisieren der einzelnen Informationsbausteine. Beim jeweiligen Aufruf des Dokumentes ist dann sichergestellt, daß immer ein konsistenter und aktueller Gesamtzustand erzeugt wird.

Der kommunikationstechnische Aspekt des Dokumentenaustauschs ist heute durch die Verfügbarkeit von OSI-konformen Rechnernetzen und Post-Diensten, wie X.25, X.400 und in Zukunft verstärkt auch durch ISDN und Breitband-Kommunikationssysteme, weitgehend gelöst. Ungelöst ist dagegen vielfach der softwaretechnische Aspekt des Dokumentenaustausches zwischen verschiedenen Rechnerwelten.

Die Beachtung internationaler Standards wie ODA/ODIF, CDA/DDIF, SGML als neutralen Datenaustauschformaten zwischen heterogenen Anwendungssystemen ist deshalb heute unumgänglich. Aber auch die auf Datenbanken gestützte Verwaltung und Archivierung von umfangreichen strukturierten Dokumenten, die durch verteilte Bearbeitung entstehen, gewinnt zunehmend an Bedeutung.

Oft mehrfache Medienbrüche notwendig

In der Praxis ist eine unternehmensweite verteilte Dokumentenverarbeitung zur Zeit höchstens in Ansätzen realisiert. Oft sind mehrfache Medienbrüche notwendig, um das Enddokument zu erzeugen, das heißt, daß bereits erfaßte, strukturierte, ausgezeichnete und mit Bildern, Grafiken und Layout-Informationen versehene Dokumente nur teilweise oder gar nicht in das Zielsystem übertragen werden können und deshalb wieder neu erfaßt werden müssen. Text-, Bild- und Grafikintegration sind oft unbefriedigend gelöst, Post-Dienste wie Telefax und Teletex sind nicht integriert nutzbar.

Erforderlich sind aber schon jetzt Werkzeuge zur integrierten Dokumenten-bearbeitung auf heterogenen Rechnersystemen unter Nutzung von unterschiedlichen Anwendungssystemen.

Die Entwicklung geeigneter Dokumentenaustausch-Standards hat erst die Werkzeuge geschaffen, die benötigt werden, um strukturierte Dokumente austauschen zu können. Die Entwicklung ist dabei mehrgleisig verlaufen. In den USA wird sehr stark SGML (Standard Generalized Markup Language) als allgemeiner Standard akzeptiert. Obwohl SGML von seinem Konzept her in die Klasse der Batch-Formatierer einzuordnen ist, sind heute gleichwohl intelligente Editoren verfügbar, die das Erzeugen von SGML-Dokumenten so gut unterstützen, daß der Anwender nahezu wie mit einem WYSIWG-System arbeiten kann.

In Europa ist dagegen durch die Förderungsaktivitäten der EG sehr viel stärker ein anderer Ansatz ODA (Office Document Architecture), vertreten. Die Digital Equipment Corp. hat sich an dieses Konzept angelehnt und einen eigenen Standard unter dem Namen CDA (Compound Document Architecture) entwickelt, der sehr stark auf ODA aufbaut, aber einige weitergehende Features enthält, die im ODA-Konzept anfänglich fehlten, wie die Verarbeitung von Tabellendaten, Formelsatz, Index und Inhaltsverzeichnis, Video- und Sprachdaten.

Die Architektur ist von Digital offengelegt und ermöglicht Fremdanbietern, zusammen mit dem zur Verfügung stehenden Toolkit, CDA-konforme Applikationen zu entwickeln. Digital selbst hat bereits eine Reihe von CDA-Produkten am Markt.

Entwicklungen langsam vorangekommen

Durch den langwierigen Normungsprozeß - ODA ist inzwischen die ISO-Norm 8613 geworden - sind Entwicklungen im ODA-Bereich nur langsam vorangekommen, so daß zur Zeit noch fast keine ODA-konformen Applikationen verfügbar oder gar kommerziell nutzbar sind. Entwicklungen sind jedoch an vielen Stellen zu erkennen und werden sicher in näherer Zukunft zu verfügbaren Werkzeugen führen.

Konverter zwischen zwei Systemen sind immer Filter, die Teile der vorhandenen Informationen herausfiltern, da sie nur die Schnittmenge beider Funktionalitäten abbilden, nicht jedoch die Spezialitäten der einzelnen Systeme umsetzen können.

Der einfache Geschäftsbrief sollte eigentlich nicht ein Problemfall sein, würde man zunächst vermuten. Die Schwierigkeiten beginnen aber bereits, wenn man versucht, diesen mit einem Standard-Textsystem geschriebenen und formatierte Brief in eine andere Rechnerwelt zu transportieren. Da stimmen plötzlich Zeichensätze nicht mehr, deutsche Umlaute sind durch unaussprechliches EDV-Chinesisch ersetzt und die Formatierung hat nichts mehr mit der ursprünglichen zu tun. Bereits hier sind Konverter für die Umsetzung notwendig.

Sehr viel gravierender ist das Problem, strukturierte und ausgezeichnete Dokumente aus dem Bereich der technischen Dokumentation, die mit einem Publishing-System erzeugt wurden, in ein anderes System zu übertragen, ohne daß die bereits vorhandenen Struktur- und Auszeichnungsinformationen verlorengehen. Konverter hierfür sind meist nur mit hohem Entwicklungsaufwand zu erstellen, da derartige Publishing-Systeme über komplexe Datenstrukturen und Funktionalitäten verfügen, die nur mit hohem Aufwand in andere komplexe Strukturen umgesetzt werden können. Inkompatible Designkonzepte der einzelnen Systeme können die Entwicklung zusätzlich erschweren.

Es kann nicht darum gehen, im Menge von unterschiedlichen Anwendungssystemen über Konverter zu verbinden und eine Menge von X-Y-Konvertern zu entwickeln, vielmehr muß es das Ziel sein, Dokumentenaustausch-Standards anzuwenden oder speziell zu entwickeln und die einzusetzenden Anwendungssysteme nach ihrer Kompatibilität zum gewählten Standard auszusuchen. Konverter werden dann nur in Hinblick auf die Unterstützung dieser Standards entwickelt oder beschafft.

Der Einsatz von Konvertern ruft möglicherweise jedoch auch positive Aspekte hervor: Intelligente Konverter können nämlich genutzt werden, um die Einhaltung bestimmter unternehmenseigener Dokumenten standards zu erzwingen und so zu verhindern, daß durch Ausnutzung letzter Feinheiten einzelner Systeme unnötiger Aufwand bei der Dokumenten-erstellung betrieben wird.

Denn es ist nicht sinnvoll, spezielle Features eines Systems auszunutzen, wenn genau diese Feinheiten im Zielsystem wieder verlorengehen, da sie dort nicht unterstützt werden oder nicht sinnvoll umsetzbar sind. Intelligente Konverter sollten deshalb konfigurierbar sein, um sie damit den unternehmenseigenen Dokumentenstandards flexibel anpassen zu können.

Die Einführung derartiger Standards sollte generell angestrebt werden. Dann sind jedoch auch Werkzeuge notwendig, die die Einhaltung dieser Standards kontrollieren oder gar erzwingen.

Dynamisch veränderbare lnformationsbausteine

Die Entwicklung geht von der Datenverarbeitung zur intelligenten Dokumentenverarbeitung. Dokumente sind in Zukunft nicht mehr einfache statische Textdateien, sondern dynamisch veränderbare, aus verschiedenen "Views" betrachtbare Mengen von Informationsbausteinen, die mit einer Reihe von Anwendungssystemen er zeugt und mit einem Integrations- und Verwaltungswerkzeug aufbereitet werden können.

Als Dokumente fungieren damit nicht mehr als Schriftstücke, sondern als elektronisch verwaltete und gespeicherte komplexe Datenstrukturen. Das Austauschmedium ist nicht mehr das Papier, sondern das Netzwerk.

Neue Werkzeuge unterstützen in Zukunft besser die bereits definierten und in vielen Bereichen auch ausreichenden Austauschstandards, intelligente Konverter werden die noch bestehenden Gräben zu überbrücken helfen und letztlich muß ein unternehmensweites Konzept zur integrierten Dokumentenverarbeitung entwickelt und umgesetzt werden. Unternehmensweit sind ebenfalls Dokumentenstandards zu definieren, und der Einsatz entsprechend intelligenter Filter oder Konverter wird deren Einhaltung sichern.