Automatisierte Textildokumentation in vier Sprachen

Titus übersetzt 12 Sätze pro Sekunde

23.01.1976

PARIS - Während die weltweiten Arbeiten am perfekten Übersetzungscomputer bislang auch nicht annähernd zum Erfolg geführt haben, sind Dokumentationsspezialisten der internationalen Textilindustrie klammheimlich einen wichtigen Schritt vorangekommen. In Paris betreiben sie ein Dokumentationszentrum samt Übersetzungscomputer, der zwar nicht Goethe und Shakespeare übertragen kann, wohl aber automatengerecht formulierte Fachtexte nach Belieben in Deutsch, Französisch, Englisch oder Spanisch ausgibt.

Es geht im Jahr um etwa 100 000 Textil-Veröffentlichungen, die laufend ausgewertet sein wollen. Nach Aussonderung von Doppelpublikationen bleiben immer noch rund 25 000 Originaldokumente mit 50 bis 60 Millionen Wörtern. Da bei weitem nicht alle wichtigen Beiträge in Englisch erscheinen, muß man die weltweite Fachpublizistik mindestens in den genannten vier Sprachen verfolgen.

Die Düsseldorfer "Zentralstelle für Textil-Dokumentation und -information" ZTDI) arbeitet seit 1971 mit der internationalen "Titus"-Organisation zusammen, in der auch die Textilwirtschaft Belgiens, Frankreichs, Großbritanniens, Italiens, Spaniens, Südamerikas und der USA repräsentiert sind. Titus steht für "textile information treatment users" und manifestiert sich heute als beim Pariser "Institut Textile de France" installierte IBM 360/30 mit 96 K, Betriebssystem DOS und Assembler-Programmierung. Das Düsseldorfer Terminal der ZTDI, eine IBM 3270 samt Modem, Steuereinheit, zwei Datensichtgeräten und Drucker, ist über DFÜ-Leitung mit Paris verbunden.

Vollautomatisches System

Titus war bisher eigentlich nur eine international beschickte Datenbank, die bestimmte Fach-Schlüsselwörter zum Auffinden der einzelnen Artikel automatisch in fünf Sprachen übertragen konnte - die Beiträge selber ließen sich aber nur im Original oder in Französisch abrufen. Die neueste Ausbaustufe Titus II ist ein vollautomatisches Dokumentations- und Übersetzungssystem.

Kanonische Dokumentationssprache

Vorbedingung für dessen Entwicklung war, das vorhandene Quellenmaterial wie Fachzeitschriftenbeiträge, Dissertationen, Bücher etc. von qualifizierten Autoren in der jeweiligen Landessprache nach einer dem Computer verständlichen Standard-Syntax umformulieren zu lassen. Die Titus-Leute entwickelten dazu die "kanonische Dokumentationssprache" (KDS), die der natürlichen Sprache zwar weitgehend entspricht, es dem Computer aber ermöglicht, den Output in der Syntax der gewünschten Sprache zu schreiben.

Skelettsätze als Arbeitsbasis

Die Verfasser von Kurzreferaten für die Titus-Datenbank haben die Wahl zwischen bestimmten immer wiederkehrenden Skelettsätzen, die codiert eingegeben und jeweils mit den passenden Wörtern der Fach- und Umgangssprache aufgefüllt werden. Diese Wörter finden sich auch im mehrsprachigen Thesaurus des Rechners wieder, so daß er auf Grund der vorgegebenen Skelettsatz-Kodierung und syntaktischen Sonderanweisungen für die einzelnen Sprachen das aufgefüllte Satzskelett in jeder der vier Sprachen sachlich korrekt und verständlich wiedergeben kann, und zwar mit einem Tempo von 12 Sätzen pro Sekunde. Am Rande sei vermerkt, daß der Computer mit der deutschen Sprache die größten Schwierigkeiten hatte.

Egon Schmidt ist freier Wissenschaftsjournalist