Typografische Gründe bedingen wechselseitige Abhängigkeiten, aber:

Trennung von Inhalt und Layout ist entscheidend

14.11.1986

Textverarbeitungssysteme haben inzwischen im Software-Repertoire für kleine und mittlere Rechner ihren festen Platz. Die verfügbaren Produkte basieren jedoch auf unterschiedlichen Benutzermodellen. Johannes Röhrich* vergleicht in seinem zweiteiligen Beitrag die einzelnen Modelle, die bei Textverarbeitungssystemen Pate gestanden haben und beleuchtet in diesem Zusammenhang entsprechende Produkte aus der Unix-Welt.

Die Benutzer typischer Arbeitsplatzrechner verbringen einen großen Teil ihrer Zeit mit der Erstellung neuer und der Änderung und Ergänzung existierender Dokumente. Deshalb bilden Textverarbeitungssysteme heute einen der wichtigsten Bestandteile der Software-Ausstattung kleinerer bis mittelgroßer Rechensysteme. Dies gilt nahezu gleichermaßen für Arbeitsplätze im Büro, in der industriellen Forschung und Entwicklung sowie im wissenschaftlichen Bereich.

Begonnen hat diese Entwicklung vor etwa einem Jahrzehnt. Es gab zwar schon vorher primitive Textverarbeitungssysteme, sogenannte Formatierer, auf Großrechenanlagen; die damit erzielbare Qualität war aber gering und erreichte oftmals nicht einmal die eines sorgfältig geschriebenen Schreibmaschinenmanuskripts. Heutige Textverarbeitungssysteme ermöglichen es hingegen, zumindest direkt am Arbeitsplatz und mit verhältnismäßig geringem Aufwand Dokumente herzustellen, deren typographische Qualität an die professioneller Druckerzeugnisse heranreicht. Zusätzlich zum Rechner benötigt man hierzu lediglich Ausgabegeräte mit entsprechend hoher Auflösung.

Einteilung in zwei verschiedene Kategorien

Die verfügbaren Systeme können in zwei Kategorien eingeteilt werden, die sich vor allem in der Art der Benutzung unterscheiden.

Die erste Kategorie bilden Systeme, die einen Eingabetext mit eingestreuten Anweisungen zur Formatierung und typographischen Gestaltung in das graphisch voll ausgestaltete Dokument umsetzen. Der Eingabetext, der dieses Dokument gewissermaßen nur "beschreibt", wird vom Benutzer separat mit einem gewöhnlichen Texteditor erstellt. Der Vorgang ähnelt stark dem der Herstellung von Programmen, die ja ebenfalls zunächst in einer höheren Programmiersprache geschrieben und erst dann in ihre endgültige Form, ausführbarer Maschinencode, übersetzt werden, weshalb Textverarbeitungssysteme dieser Kategorie oft auch als Dokumenten-Compiler bezeichnet werden.

Ist der Arbeitsplatz mit einem Rasterbildschirm hinreichender Auflösung ausgestattet, so können Dokumente auch interaktiv, nach dem WYSIWYG-Prinzip ("What You See Is What You Get") erstellt werden. Charakteristisch an dieser Arbeitsweise ist, daß der Benutzer das eigentliche, graphisch ausgestaltete Dokument vor Augen hat und so nicht nur den Inhalt, sondern auch die Gestalt des Dokuments unmittelbar beurteilen und durch sofort wirksam werdende Operationen beeinflussen kann.

Unter dem Betriebssystem Unix stehen Textverarbeitungssysteme beider Kategorien zur Verfügung: "Troff" beispielsweise ist ein typischer, durch Erweiterung des Funktionsumfangs aus dem "Runoff"-Formatiersystem entstandener Dokumenten-Compiler, der mit seinen Makro-Paketen sowie den diversen Zusatzwerkzeugen zur Erstellung von Formeln, Tabellen, Graphiken und Literaturverzeichnissen schon seit langem als Standard-Textverarbeitungssystem in der Unix-Welt gilt. Prominentester Vertreter der auf Unix ablauffähigen "WYSIWYG"-Systeme ist sicherlich das Interleaf-System, das mittlerweile auf einer Reihe von Arbeitsplatzrechnern, darunter Sun, Cadmus, und neuerdings auch IBM RT-PC, verfügbar ist.

Nachfolgend werden verschiedene Benutzermodelle existierender Textverarbeitungssysteme verglichen. Dabei stehen hauptsächlich Probleme des Spaltenumbruchs und der Seitenmontage im Mittelpunkt, denn in diesen Bereichen finden sich die wesentlichen Unterschiede.

Die Anforderungen an ein Textverarbeitungssystem können in zwei Gruppen geteilt werden. Einerseits muß die Erstellung des sprachlichen und bildlichen Gehalts eines Dokuments wirksam durch ein adäquates Benutzermodell und eine ergonomisch gestaltete Benutzerschnittstelle unterstützt werden. Dabei ist zu berücksichtigen, daß der Autor bei seiner schöpferischen Tätigkeit nicht durch den Zwang zu gestaltender Auszeichnung abgelenkt werden darf. Andererseits sollte die typographische Qualität des fertigen Dokuments so hoch wie möglich sein.

Diese Forderungen sind an sich antagonistisch. Ein gut gestaltetes Dokument kann mit seinen verschiedenartigen Schriften und seinen ansprechend aus Textblöcken und Bildern aufgebauten Seiten weitaus mehr zum Ausdruck bringen als Text und Bild alleine: Es ist viel informationsreicher. Die Gestaltung eines Dokuments erfordert deshalb immer Tätigkeiten, die über die reine Erfassung des textuellen und bildlichen Gehalts hinausgehen, und die man zumindest zum Teil dem Benutzer aufbürden muß. Jedoch kann die prozedurale, konkrete und detailreiche Auszeichnung vieler existierender Textverarbeitungssysteme in dieser Hinsicht erheblich verbessert werden. Grundlegend hierfür ist ein geeignetes Benutzermodell.

Man unterscheidet dabei zwischen dem Benutzermodell eines Systems und seiner Benutzerschnittstelle. Das Benutzermodell dient dazu, die Funktionalität des Systems in möglichst einprägsamen, durchsichtigen Begriffen zu erklären, ohne auf die tatsächlich realisierte Struktur Bezug zu nehmen. Die Benutzerschnittstelle besteht dagegen aus den konkreten Operationen, die dem Benutzer zur Verfügung stehen, ihrer syntaktischen Repräsentation und ihrer Semantik.

Schreibmaschine dient als Benutzermodell

Ein naheliegendes Benutzermodell für ein Textverarbeitungssystem ist die Schreibmaschine. Ergänzt um Umschaltfunktionen für verschiedene Schriften, automatischen Zeilenumbruch und Blocksatz bildet dieses Schreibkopf-Bewegungs-Modell die Grundlage vieler existierender Textverarbeitungssysteme. Vieles bleibt allerdings bei diesem Modell dem Benutzer überlassen, zum Beispiel die Bestimmung der Breite von Tabellenspalten, die gewöhnlich mit Tabulatoren gesetzt werden, die Höhenberechnung und Plazierung von Fußnoten oder die Feinpositionierung von Zeichen in zweidimensionalen mathematischen Formeln. Auch der Umbruch in Spalten und die Montage von Seiten aus Text, Titeln und Abbildungen sind im Schreibmaschinenmodell nicht adäquat wiedergegeben.

User-Schnittstelle ist prozedural ausgelegt

Die Benutzerschnittstelle eines auf dem Schreibmaschinenmodell basierenden Textverarbeitungssystems ist in natürlicher Weise prozedural; es sind konkrete Befehle, die die Maschine zum Bewegen des Schreibkopfes und zum Setzen von Schriftzeichen veranlassen. Beutet man dieses Konzept weiter aus, so gelangt man zur programmierbaren "Formatiermaschine", die - zusätzlich zu einfachem Schreiben, Umschalten und Bewegen - Variable, Zuweisungen und eine Reihe weiterer, mächtiger Operationen besitzt. Zu diesen gehören vor allem Funktionen zur Bestimmung der Dimensionen eines fertig gesetzten Textstücks sowie ein Unterbrechungskonzept, mit dessen Hilfe man Aktionen wie die Montage einer Abbildung an gewissen horizontalen oder vertikalen Positionen - etwa am Seitenende - vornehmen kann. Ein prominenter Vertreter für eine solche Formatiermaschine ist das Troff-System, das mit seinen Erweiterungen allerdings einen großen Teil der erwähnten Positionsberechnungen selbständig durchführt.

Im Schreibmaschinen-Modell dienen Unterbrechungen an gewissen vertikalen Positionen auf der Seite an sich dazu, diese in Teilflächen aufzuteilen, in die bestimmte, fertig gesetzte Texte oder Abbildungen montiert werden, oder in die man laufend Text "hineinfließen" lassen möchte. Ein derartiges dem Bleisatz von Hand ähnelndes Benutzermodell liegt dem TEX-System zugrunde. Text wird bei diesem sogenannten Block-Feder-Modell in eine vorgegebene Fläche - in der Regel eine Spalte - gesetzt. Die so entstehenden Textblöcke werden gemäß einer im wesentlichen deklarierten Beschreibung zusammen mit Titeln, Fußnoten und Abbildungen zu einer Seite zusammenmontiert.

Im Gegensatz zum manuellen Setzen legt man jedoch keine absoluten Positionen der Textblöcke fest, sondern hängt sie zwischen "Federn" auf, deren Stauch- und Dehnbarkeit man so bestimmt, daß die Minimierung der Summe aller Federkräfte zu einem ausgewogenen und ästhetisch ansprechenden Seitenaufbau führt. Das TEX-System wendet dieses Konzept auch "im Kleinen", bei der Bildung von Zeilen und Absätzen an: sogar die einzelnen Schriftzeichen werden als Blöcke aufgefaßt und - in der Regel impliziert - mittels Federn zu Wörtern und Zeilen verbunden.

Deklarative Beschreibung bietet oft Vorteile

Das Schreibkopf-Bewegungs-Modell ist einleuchtend, leicht erlernbar und - vor allem wegen der Analogie zur Schreibmaschine - gut zur interaktiven Bearbeitung des Schriftbildes eines Dokuments geeignet. Komplexere Umbruch- und Montageaufgaben können jedoch besser mit dem Block-Feder-Modell gelöst werden: Eine deklarative Beschreibung des Layouts ist einer "Programmierung" mittels Unterbrechung sicherlich vorzuziehen.

Ein Benutzermodell für die Textverarbeitung sollte auf jeden Fall die Zweiteilung des Problems in "Erstellung des Schriftbildes im Kleinen" und "Anordnung auf der zur Verfügung stehenden Fläche" explizit widerspiegeln. Zwar gibt es aus typografischen Gründen zwischen beiden Teilproblemen subtile, wechselseitige Abhängigkeiten. Das letzte Wort einer ungeraden Seite sollte zum Beispiel nicht getrennt werden, weil der Leser sonst mitten im Wort umblättern müßte. Ein brauchbares System muß aber gerade solche Schwierigkeiten ohne Mithilfe des Autors bewältigen.

Manipulationen müssen nachträglich möglich sein

Es gibt weitere Gründe, die für eine Trennung zwischen Schriftbild und Layout sprechen. Aus Sicht des Benutzers ist der sprachliche Gehalt eines Dokuments im allgemeinen unabhängig von der Flächenaufteilung. Er möchte beides getrennt manipulieren und häufig auch die Flächenaufteilung nachträglich festlegen beziehungsweise ändern können.

Schließlich erfordert die Flächenanordnung sicherlich eine andere Benutzerschnittstelle und -sicht auf das Dokument als die Erstellung und Änderung des textuellen Gehalts und der Auszeichnung. Zum Layout muß man einen möglichst großen Teil des Dokuments auf einmal und in Seitenform sehen: Der Inhalt braucht dabei nur angedeutet zu sein. Bei der Festlegung des Schriftbilds benötigt man hingegen die Sicht auf alle graphischen Details.

Text ist sprachliche Information in schriftlicher Form. Folgt man dieser Definition, so ergibt sich unabhängig vom Layout auch "im Kleinen" eine klare Trennung zwischen dem sprachlichen Gehalt eines Textes und seiner schriftlichen Gestalt Zwar bringt auch das konkrete Schriftbild inhaltliche Aspekte zum Ausdruck. Betonte Wörter werden zum Beispiel kursiv geschrieben; fett gedruckte Stichwörter ermöglichen einen raschen, "diagonalen" Überblick; Kleingedrucktes kann beim ersten Lesen übergangen werden.

Es ist jedoch nachteilig, wenn die Auszeichnung das Schriftbild konkret und in allen Einzelteilen festlegt. Erstens ist es für den Autor, der ja in der Regel kein Typograph ist, mühsam, den Text auf diese Weise konsistent auszuzeichnen, weil er dazu eine Reihe typographischer Regeln lernen und anwenden muß. Zweitens muß er sich während der Texterfassung ständig mit dem Problem der Gestaltung beschäftigen: Er wird dadurch von seiner kreativen Tätigkeit erheblich abgelenkt.

Auch die Entnahme von Zitaten aus anderen Dokumenten wird behindert; ihre Auszeichnung muß auf Konsistenz überprüft und gegebenenfalls angepaßt werden. Auszeichnung mit konkreten Schriften und Maßen macht ein Dokument geräteabhängig: Es kann nur auf solche Geräte abgebildet werden, die diese Schriften und Maße wiedergeben können. Schließlich ist eine solche Auszeichnung sehr informationsreich, wenig redundant und damit fehleranfällig.

Man kann diese Nachteile vermeiden, wenn man im Benutzermodell eine Abstraktionsebene vorsieht, die die inhaltlichen Aspekte der Auszeichnung von ihrer konkreten und typographischen Interpretation isoliert. Der Autor kann den Text dann zunächst inhaltsbezogen, deklarativ auszeichnen. Typische Auszeichnungsfunktionen dieser Art sind Stichwort, betont, Beispiel. Auch ein Nicht-Experte sollte mit solchen Funktionen umgehen und sie konsistent anwenden können. Getrennt vom eigentlichen Text - mit einer dazu geeigneten Benutzerschnittstelle und durch einen nicht notwendig vom Autor verschiedenen Gestaltungsexperten - wird festgelegt, wie diese Funktionen auf typografische Konzepte abgebildet werden.

Drei Sichten auf ein Dokument sind nötig

Zu Systemen wie TEX oder Troff gibt es Makro-Bibliotheken (zum Beispiel LaTEX beziehungsweise ME und MS), die "höhere" Auszeichnungsfunktionen definieren und damit das Problem der konsistenten, portablen Auszeichnung wenigstens teilweise lösen. Im Benutzermodell dieser Systeme sind die Makros jedoch lediglich als Abkürzungen für Sequenzen von Grundoperationen erklärt. Letztere stehen deshalb immer noch zusätzlich zur Verfügung - und werden auch benutzt.

Noch ungünstiger ist die Situation bei WYSIWYG-Systemen wie WordStar, MicroSoft Word, MacWrite oder Interleaf, die - abgesehen von primitiven Abkürzungen - keinerlei Unterstützung für deklarative, inhaltsbezogene Auszeichnung anbieten. Das Scribe-System, das Andra-System, das System Cobatef und die hinter dem ISO-Normentwurf der "Standardized Generalized Markup Language" (SGML) stehende Konzeption kommen den oben geschilderten Vortellungen sehr nahe.

Um wirkungsvoll und vor allem störungsfrei mit einem Textverarbeitungssystem arbeiten zu können ist es notwendig, die Festlegung der Flächenaufteilung (Spaltenumbruch und Seitenmontage) wie auch die konkrete Gestaltung des Schriftbildes von der eigentlichen Erfassung des Inhalts eines Dokuments zu trennen. Von der Last der Auszeichnung kann der Autor nicht ganz befreit werden; sie sollte sich aber ebenfalls am Gehalt des Dokuments orientieren und deklarativ in dem Sinne sein, daß sie die Bedeutung der ausgezeichneten Textobjekte, nicht aber ihre typographische Gestalt beschreibt.

Ein neues Benutzermodell, das im folgenden beschrieben wird, sieht drei Sichten auf ein Dokument vor.

1. Inhaltliche Sicht: Der textuelle Gehalt des Dokuments wird in einer Form gezeigt, die sich besonders zum Schreiben und Andern eignet.

2. Gestalt "im Kleinen": Diese Sicht dient zur Gestaltung des Schriftbildes, der Hervorhebung und der Einrückungen.

3. Flächenaufteilung: Hier sieht man die Einteilung des Dokuments in Seiten und deren Aufbau aus Textspalten, Titeln, Bildern und Fußnoten.

Die gestaltende Arbeit an einem Dokument kann durch ein Expertensystem unterstützt werden, dessen Wissensbasis aus den zum Teil in hohem Maße standardisierten typographischen Regeln zur Gestaltung bestimmter Klassen von Dokumenten besteht.

Aus inhaltlicher Sicht erscheint ein Dokument als "Druckfahne", die den laufenden Text enthält. Der Text kann inhaltlich erfaßt, geändert und deklarativ ausgezeichnet werden. Der Benutzer manipuliert dabei Text- und Auszeichnungsobjekte, also Zeichen, Wörter, Phrasen oder ganze Kapitel beziehungsweise Symbole oder Menü-Auswahlen, die als Auszeichnungsfunktionen auf Textobjekte wirken.

Die Auszeichnung wird sofort in einem zum Editieren geeigneten Stil interpretiert, der nicht notwendig mit dem endgültigen Schriftbild übereinstimmt. Dies gilt auch für die Form von Absätzen; sie sind unter Umständen noch nicht optimal gesetzt. Die Druckfahne ist noch nicht in Spalten oder Seiten umbrochen bei der Arbeit am Inhalt des Dokuments wirkt das nur störend. Seitenbezüge müssen ohnehin symbolisch ausgezeichnet werden, damit sie bei Verschiebungen nachgeführt werden können.

Abbildungen, Tabellen, Fußnoten, Titel und Marginalien sind entweder provisorisch in die Nähe der Stelle montiert, an der sie referiert werden, oder sie erscheinen auf eigenen "Druckfahnen". Auch solche Objekte sind symbolisch benannt, damit sie bei Ergänzungen, Löschungen und Umstellungen automatisch umnumeriert und die Gestalt der Bezüge unabhängig geändert werden kann.

Inhalts-, Stichwort- und sonstige Verzeichnisse werden automatisch generiert und erscheinen ebenfalls provisorisch montiert oder auf eigenen Druckfahnen; sie können zwar betrachtet, aber nur direkt durch Änderung der Auszeichnung im Text beeinflußt werden.

Zur Festlegung des Schriftbildes, der Gestalt "im Kleinen", werden die im Dokument enthaltenen deklarativen Auszeichnungsfunktionen auf konkrete Formatierfunktionen abgebildet. Dabei muß der Benutzer die Regeln der Typographie, die zur Verfügung stehenden Schriften und die Eigenschaften des Ausgabegeräts berücksichtigen: Er sollte allerdings von einem Expertensystem der genannten Art unterstützt werden. Hier wie auch bei der Festlegung des Layouts ist eine WYSIWYG-Sicht unbedingt sinnvoll - der Gestalter muß interaktiv das endgültige graphische Schriftbild sehen und ändern können.

Konkret gestaltet werden laufende und hervorhebende Schriften, schriftrelative und absolute Maße wie Durchschuß und Einzüge, die Schreibweise von Bezügen auf Abbildungen, Tabellen und Formeln, die Form von Überschriften, Absätzen und Titeln und ähnliche Faktoren. Eine Sicht auf das gesamte Dokument wird dazu allerdings nicht benötigt; sie ist eher hinderlich. Es genügt, wenn die - oder exemplarisch einige der - Teile sichtbar sind, in denen eine bestimmte Auszeichnungsfunktion oder eine Kombination miteinander in Beziehung stehender Auszeichnungsfunktionen vorkommt.

Maße der Flächen stehen in Relation zueinander

Die dritte Sicht auf ein Dokument, die das beschriebene Benutzermodell vorsieht, ist die Flächensicht. Aus dieser Sicht erscheint das Dokument als eine Menge rechteckiger Flächen, zwischen denen gewisse inhaltliche und auch geometrische Relationen bestehen. In diese Flächen "fließt" der Text hinein. Da es darauf ankommt, einen möglichst großen Teil des Dokuments auf einmal zu sehen, ist der textuelle Inhalt der einzelnen Flächen jedoch nur angedeutet, zum Beispiel durch Striche, Stichwörter oder Titel.

Die Maße der Flächen sind nicht isoliert festgelegt, sondern stehen in arithmetischen und logischen Beziehungen zueinander. So "knabbert" zum Beispiel das Rechteck für eine Fußnote an der diese referierenden Textspalte; beide füllen, zusammen mit einem dazwischenliegenden, in Grenzen dehn- und stauchbaren Raum, den Satzspiegel in vertikalen Richtungen.

Ähnliche Beziehungen können auch zwischen Flächenaufteilung und Schriftbild im Kleinen bestehen. Zum Beispiel kann man sich bei einer Tabelle im Kleinen darauf beschränken, nur die Verhältnisse zwischen den darin vorkommenden Schriftgraden zu spezifizieren. Die absoluten Schriftgrade legt man hingegen aus Flächensicht indirekt durch die Vorschrift fest, daß die Tabelle in ein bestimmtes, absolut bemaßtes Rechteck passen muß.

Freiheitsgrade in der Flächenaufteilung können zu automatischer Optimierung, zur Minimierung der typographischen "Häßlichkeit" ausgenutzt werden. Dieser Prozeß ist natürlich sehr rechenintensiv; auf Arbeitsplatzrechnern mit Leistungen in der Größenordnung einiger weniger Mips wird man mit Antwortzeiten rechnen müssen, die sich bei umfangreichen Dokumenten bis in den Minutenbereich ausdehnen können. Gerade aus diesem pragmatischen Grund erscheint es wesentlich, daß die eigentliche Erfassung des Gehalts von der Festlegung der Gestalt losgelöst mit geringem Rechenaufwand und daher kurzen Antwortzeiten erfolgen kann.

Die daraus resultierende Abweichung vom WYSIWYG-Konzept ist vertretbar, wenn nicht gar begrüßenswert. Welchen Autor stört es nicht, wenn schon geringfügige Änderungen eine völlig neue Anordnung des im Fenster sichtbaren Dokumenten-Teils bewirken.

Bei Expertensystemen sind die typographischen Regeln zur Gestaltung für bestimmte Klassen von Dokumenten in hohem Maße standardisiert. Solche Klassen sind zum Beispiel mathematische, technische oder naturwissenschaftliche Berichte, Kongreßbeiträge, Zeitschriftenartikel, Lehrbücher oder Monographien. Textverarbeitungssysteme wie "Scribe", "Andra" oder "Cobatef" sehen aus diesem Grund sogenannte Dokumenten-"Stile" vor, in denen die Interpretation der gestaltenden, deklarativen Auszeichnungen für jeweils eine Dokumentenklasse festgelegt wird - bei "Andra" beispielsweise durch Ausfüllen eines Formulars.

Dieser Konzeption fehlen jedoch wesentliche Eigenschaften eines Expertensystems. Dazu zählen Funktionen, um Regeln im eigentlichen, allgemeineren Sinne festlegen zu können, interaktiv mit der Gestaltung zu experimentieren oder Konsequenzen, die das System automatisch aus den Regeln herleitet, zu beurteilen.