Utopie und Realität computergestützter Übersetzungssysteme

Die Sprache paßt nur bedingt in ein elektronisches Korsett

28.02.1992

*Marianne Goldschmidt ist Geschäftsführerin der Acom Information Services AG, Basel und Lörrach, die Unternehmensberatung für Sprachdatenverarbeitung sowie Fachübersetzungs- und Dolmetscherdienste anbietet.

Der europäische Binnenmarkt der 90er Jahre wird von einem babylonischen Sprachgewirr geprägt sein. Der Gedanke daran, daß sie eines Tages ihre Produktbeschreibungen und Werbeträger in mehreren Sprachen gleichzeitig vorlegen müssen, läßt exportorientierte Unternehmen bereits heute erschaudern. Marianne Goldschmidt* beschreibt, inwiefern "Computer Aided Translation" (CAT) und "Machine Aided Translation" (MAT) dabei behilflich sein können.

Jährlich werden in Europa zirka 100 Millionen Textseiten übersetzt und Milliarden Mark für die Übertragung von Sprachen ausgegeben. Die EG beispielsweise wendet bereits heute etwa ein Drittel ihrer Personalkosten nur für Übersetzungen auf. Japan gibt einige Milliarden Yen pro Jahr für fremdsprachige Produktdokumentationen aus; mehr als 20 kommerzielle Computer-Übersetzungssysteme wurden dort bereits in Betrieb genommen. Und die allgemeine Tendenz ist steigend.

Bei den elektronischen Hilfsmitteln zur Übersetzung werden - je nach dem Grad der Automatisierung im Übersetzungsprozeß - meist nur noch zwei Hauptgruppen unterschieden. Dabei handelt es sich zum einen um den Integrierten Übersetzerarbeitsplatz, der aus Terminologie-Datenbanken, also elektronischen Wörterbüchern, und verschiedenen Tools zur Unterstützung der menschlichen Übersetzung besteht, zum anderen um die reine maschinelle Übersetzung.

Datenbankgestützte Wörterbücher

Beim integrierten Übersetzerarbeitsplatz sitzt der Übersetzer - in der Regel übrigens eine Frau - am PC und arbeitet mit einem Standard-Textverarbeitungsprogramm. Gleichzeitig besteht via Bildschirm Zugriff auf eine Terminologie-Datenbank. Dieses elektronische Wörterbuch kann ein speicherresidentes Programm in Form eines Fensters am Bildschirm oder eine separate Datenbank sein, die jederzeit zum Nachschlagen und Ergänzen der fehlenden fremdsprachigen Entsprechungen unbekannter Wörter verfügbar ist.

Die meisten dieser Datenbanken basieren auf einem herkömmlichen relationalen DBMS-Produkt und verwenden deren vordefinierte Strukturen. Beispiele von relationalen Datenbanken für die Verwendung auf PC-Ebene sind TermPC/Termtrans von Siemens-Nixdorf und Multiterm von Trados aus Deutschland sowie Aquila von Site aus Frankreich, um nur die bekanntesten Namen zu nennen.

Neben diesen traditionellen Datenbanken gibt es ein Terminologie-Verwaltungssystem auf dem PC, nämlich Mecury/Termex von Eurolux in Luxemburg, das im Gegensatz zu den in sich geschlossenen Systemen frei strukturierbar ist. Darüber hinaus liefert das Produkt bereits bestehende, mehrsprachige elektronische Wörterbücher auf Disketten gleich mit. Diese käuflich erworbenen Nachschlagewerke können dann parallel zu selbst erfaßten Firmenterminologien eingesetzt werden.

Eine Sonderstellung unter den Terminologie-Datenbanken nehmen die großen - staatlichen oder von Großkonzernen unterhaltenen - Online-Datenbanken ein. Zu diesen Host-Applikationen gehören die von der Europäischen Gemeinschaft in Luxemburg verwaltete Datenbank Eurodicautom sowie Terminum von der kanadischen Regierung und Team von Siemens.

Bei der Terminologiearbeit zu einer Übersetzung kann die Suche nach einem fremdsprachlichen Begriff sehr aufwendig sein. Die Wiederverwendbarkeit der gefundenen Termini ist besonders dann wichtig, wenn ein Übersetzer aus einer Firma austritt - nach dem Motto: "Der Mitarbeiter geht, aber der mehrsprachige Firmenwortschatz bleibt." Darin besteht ein nicht zu unterschätzender Kostenfaktor. Terminologie-Datenbanken sind sinnvolle Hilfsmittel für den Sprachendienst und fördern die Arbeitsteilung zwischen Mensch und Maschine bei stilistisch anspruchsvollen Texten. Der Übersetzer denkt und lenkt, der Computer übernimmt die Fleißarbeit.

Maschinelle Übersetzungssysteme

Für schwierige und sprachlich ausgefeilte Texte wird der integrierte Übersetzerarbeitsplatz, bei dem der Mensch - wenn auch unter Einbeziehung aller nur denkbaren elektronischen Hilfsmittel - die Übersetzungsarbeit leistet, auch langfristig kaum an Bedeutung verlieren. Dennoch hat die Idee, den Computer allein übersetzen zu lassen, bereits seit langem einen gewissen Reiz.

Die Computer, die dazu in der Lage sind, nennt man MAT- oder auch MT-Systeme. Sie werden vor allem in zwei Untergruppen unterteilt:

- Bei den Pre-editing-Systemen wird der zu übersetzende Text vorbereitet;

- bei den Post-editing-Systemen wird die Rohübersetzung nachträglich korrigiert.

Text muß angepaßt werden

Die erste Gruppe dieser "Übersetzungsmaschinen" kann nur auf die Bedürfnisse des Computers zugeschnittene Texte übersetzen. Der zu übersetzende Text muß also sprachlich angepaßt werden. Ein einleuchtendes Beispiel für diese Art der Textvorbereitung ist ein in Kanada seit Jahren erfolgreich eingesetztes Computersystem, das ausschließlich Wetterberichte übersetzt, die bekanntlich keinen anspruchsvollen Sprachstil haben.

Die Versuche einiger Konzerne in den USA, ihre Mitarbeiter durch am Bildschirm vorgegebene Wortlisten dazu zu bewegen, beim Formulieren eines Textes nur einen ganz beschränkten Wortschatz und vorbestimmte grammatikalische Strukturen zu verwenden, stellt eine weitere Form des Pre-editing dar. Die Maschine kann dann solche Texte problemlos in mehrere Sprachen gleichzeitig übertragen. Diese Methode ist jedoch kein legitimer Weg, der Maschine die Arbeit zu erleichtern, da er zwangsläufig zu einer Verarmung der Sprache führt.

Die Idealvorstellung vom maschinellen Übersetzen wäre: Der Computer arbeitet Tag und Nacht, die Übersetzerin gibt dem Produkt nur noch den letzten Schliff. Aber wenn das so einfach wäre, würden viele Firmen und Behörden mit Sicherheit auch sechsstellige Investitionen nicht scheuen, um ihre Übersetzungsprobleme ein für allemal zu lösen.

Die Wirklichkeit sieht etwas anders aus; sie ist allerding keineswegs so trostlos, wie sie von manchem selbsternannten Experten in Sachen Maschinenübersetzung - oft aus Mangel an praktischer Erfahrung - dargestellt wird. Gezielt, also am richtigen Ort eingesetzt, hat die maschinelle Übersetzung durchaus ihre - auch wirtschaftliche - Existenzberechtigung, indem sie den Sprachendienst von lästiger Routinearbeit befreit.

Es ist jedoch kein Geheimnis daß man jedes maschinelle Übersetzungssystem mit Texten aus der Fassung bringen kann, in denen der Sinn eines Satzes zwischen den Zeilen sieht. Für den Computer ist jede gewollte oder ungewollte Mehrdeutigkeit tödlich; er ist immer dann überfordert, wenn zusätzliche Kenntnisse sozio-kultureller Gegebenheiten oder Hintergrundwissen vorausgesetzt werden, also Allgemeinbildung oder spezielles Fachwissen beziehungsweise Texte, in denen der Autor es dem Übersetzer überläßt, Unklarheiten zu beseitigen.

Wo es um konkrete Sachverhalte, um technische oder repetitive Texte geht, stellen maschinelle Übersetzungssysteme jedoch durchaus eine ökonomisch sinnvolle Alternative zu der vom Menschen angefertigten Übersetzung dar.

Die maschinelle Übersetzung eignet sich vor allem für Stück- oder Sortimentslisten (sowie für Wetterberichte), für technische Handbücher und einfache Bedienungsanleitungen, also Texte, in denen stilistische Merkmale nur eine untergeordnete Rolle spielen. Die bekanntesten Vertreter der maschinellen Übersetzung sind Metal von Siemens-Nixdorf (SNI) in München, Logos von der Logos Corp. mit deutschem Sitz in Frankfurt am Main und Systran von der Gachot S.A., Paris. Die Arbeitsleistung von MAT-Systemen bewegt sich zwischen fünf und mehr als 200 Seiten pro Stunde, abhängig von Rechnergröße und -leistung. Der Output einer menschlichen Übersetzerin dagegen ist zwangsläufig wesentlich geringer, nämlich fünf bis 15 Seiten pro Tag, je nach dem Schwierigkeitsgrad des zu übersetzenden Textes. Dafür ist die Übersetzung meist aber auch von besserer Qualität.

Am Beispiel des SNI-Systems Metal soll hier die Funktionsweise eines selbständig arbeitenden maschinellen Übersetzungssystems kurz dargestellt werden: Metal ist ein modulares System, das sich vor allem für die Übersetzung von technischen Dokumenten anbietet. Im Computer durchläuft der zu übersetzende Text die Etappen Analyse, Transfer und Synthese.

Bei der Analyse, die sich nur auf die Ausgangssprache des zu übersetzenden Textes bezieht, wird durch Anwendung der gespeicherten Grammatik und der im Wörterbuch gesammelten Informationen der gesamte Satz in all seinen Bestandteilen analysiert.

Erst wenn jedes Wort hinsichtlich seiner Funktion im Satz und seiner Bedeutung definiert ist, wird der Satz in die Zielsprache transferiert. In der Synthese, die sich wiederum nur mit der Zielsprache befaßt, wird der übertragene Satz entsprechend den Regeln der Zielsprache neu geordnet und den dort herrschenden Besonderheiten angepaßt.

Wichtig ist dabei, daß der Computer nicht Wort für Wort übersetzt, was zwangsläufig zu den berühmt berüchtigten Stilblüten der Übersetzungscomputer auf PC-Ebene oder im Taschenformat führt. Die großen MAT-Systeme übersetzen im Satzzusammenhang, unter Berücksichtigung der für jede Sprache spezifischen grammatikalischen und lexikalischen Strukturen. Ein weiterer Vorteil dieser Systeme liegt in der Einheitlichkeit der verwendeten Terminologie auch bei umfangreichen Texten, was zum besseren Verständnis der Übersetzung beiträgt.

Aber auch die leistungsfähigen maschinellen Übersetzungssysteme können - im Gegensatz zum menschlichen Gehirn - nur Rohübersetzungen liefern. Denn Sprache lebt. Sie läßt sich nur begrenzt in ein elektronisches Korsett zwängen. Die von der Maschine erstellte Übersetzung muß am Bildschirm überarbeitet und stilistisch korrigiert werden.

Für große Textmengen von einfacher Struktur

Generell gilt, daß beim Einsatz eines Computersystems für die Übersetzung von Sprachen immer erst geprüft werden muß, für welche Textarten, mit welchem mehr oder weniger komplexen Gehalt und nicht zuletzt für welches Übersetzungsvolumen die Maschine eingesetzt werden soll. Ein maschinelles System lohnt sich vor allem dort, wo in möglichst kurzer Zeit große Textmengen von einfacher Struktur und überschaubarem Inhalt übersetzt werden sollen.

Es ist deshalb von großem Vorteil, wenn bei der Schriftgutanalyse und der Evaluierung eines solchen Systems das Know-how erfahrener Unternehmensberater aus den Bereichen Fachübersetzung, Terminologie und Computerlinguistik hinzugezogen wird.

Vor Einführung gleich welchen Systems ist jedes Unternehmen gut beraten, wenn es Informatiker und Übersetzer veranlaßt, sich mit neutralen Beratern in Sachen computergestützte Übersetzung an einen Tisch zu setzen, um gemeinsam die Vor- und Nachteile eines solchen Systems unter den im Unternehmen herrschenden Bedingungen zu prüfen. So können Vorurteile ausgeräumt, die Akzeptanz verbessert und kostspielige Fehlentscheidungen vermieden werden.