Kurze Lebenszeit von Software gefaehrdet elektronisch gespeicherte DokumenteVerlage und Wissenschaften verwalten Texte mit SGML

08.12.1995

Von Fotis Jannidis*

Auf einem Workshop in Tuebingen vom 15. bis 17. November informierten sich Vertreter von Verlagshaeusern und Textwissenschaftler ueber die Funktionsweise der Metasprache "Standard Generalized Markup Language" (SGML) und des SGML- konformen Auszeichnungssystems TEI. Verlage und Philologen ringen fuenfzehn Jahre nach Beginn der PC-Revolution mit dem gleichen Problem: Die kurze Verfallszeit von Betriebssystemen und Programmen bedroht ihre elektronisch gespeicherten Texte.

SGML behauptet sich schon seit laengerer Zeit als meistverwendete Markierungssprache fuer technische Dokumentationen und gewinnt durch das Internet, wo sich das SGML-Derivat HTML als Standard etabliert, zusaetzliche Popularitaet. SGML ist selbst keine Auszeichnungssprache, sondern eine Metasprache, mit der konkrete Auszeichnungssysteme definiert werden. Die SGML-Norm bestimmt lediglich, nach welchen Regeln die konkreten Auszeichnungen festgelegt werden. Zwischen SGML und einem konformen Auszeichnungssystem besteht also ungefaehr das gleiche Verhaeltnis wie zwischen einer Programmiersprache und einem bestimmten Programm. Die ISO-Norm 8879, in der SGML festgeschrieben ist, garantiert die Stabilitaet der Metasprache. Inzwischen existieren auf zahlreichen Plattformen Werkzeuge, die SGML-konforme Auszeichnungssysteme und Texte verarbeiten koennen: Editoren, Browser, Parser etc. Moegen diese Programme auch staendig veraendert werden, der Standard, auf dem sie beruhen, wird es nicht.

Die Text Encoding Initiative (TEI) hat in rund siebenjaehriger Arbeit ein komplexes Auszeichnungssystem entwickelt, das sowohl den Beduerfnissen von Textwissenschaftlern als auch von Verlagen mit schoengeistiger und wissenschaftlicher Literatur entsprechen soll. Die Initiative wurde gesponsert von amerikanischen Vereinigungen, die die Arbeit von Geisteswissenschaftlern mit dem Computer foerdern.

TEI entwickelt umfangreiches Auszeichnungssystem

Herausgekommen ist nun nach mehreren veroeffentlichten Entwuerfen ein 1200 Seiten starkes Werk, das sowohl ueber das Internet http://etext.virginia.edu/TEI.html als auch in Buch- und CD- ROM-Format zugaenglich ist. Einen Ueberblick ueber SGML-Software findet man unter http://www.falch.no/pepper/sgmltool.

Bei der Diskussion der Anwendungsmoeglichkeiten von TEI zeigten sich die unterschiedlichen Erwartungshaltungen von Verlagsvertretern und Textwissenschaftlern. Die Verlage suchen in erster Linie nach Wegen, Texte anwendungs- und systemunabhaengig zu lagern. Ihr altes Selbstbild, sie seien Buchproduzenten, wird durch ein neues ersetzt: Sie werden zu Textverwertern. Diese Verwertung kann in Buchform, als CD-ROM, als Online-Publikation geschehen oder sogar in allen drei Formen zugleich. Der einmal gesetzte Text soll in einem Format gespeichert werden, aus dem relativ schnell und einfach das jeweilige Endprodukt erzeugt werden kann. Ein Speicherformat fuer Texte, das unabhaengig vom jeweiligen Endprodukt ist, hoffen viele in SGML-konformen Auszeichnungen zu finden.

Bei solchen Vorstellungen handelt es sich, wie eine recht junge Umfrage belegt, nicht um Einzelstimmen: Von den Mitgliedern der Vereinigung der Wissenschaftsverlage STM gaben im Fruehjahr 1995 nur 31 Prozent an, sie wuerden zur Zeit SGML verwenden, doch 82 Prozent wollen in den naechsten drei Jahren auf diese Sprache umstellen.

Textwissenschaftler dagegen erstellen grosse Textkorpora, die ueber so lange Zeit verwendet werden sollen wie ihre gedruckten Gegenstuecke - zumindest mehrere Jahrzehnte. Die kurzen Produktzyklen im Softwarebereich verbieten es daher, sich an proprietaere Textformate zu binden. Die Arbeit an einem wissenschaftlichen Textkorpus kann schliesslich mehrere Software- Generationen ueberdauern. Ausserdem stellen Wissenschaftler an das verwendete Markup-System hohe Ansprueche in puncto Flexibilitaet. Welche Features des Textes ausgezeichnet werden sollen, bestimmen die Fragestellungen der codierenden Wissenschaftler

*Fotis Jannidis ist Dozent fuer Neuere Deutsche Literatur an der Universitaet Muenchen.