Wie man dem Computer das Sprechen lehrt

19.10.1990

Der Computer hat nicht nur Mühe mit dem Hören und Verstehen - auch das Sprechen fällt ihm schwer. Zwar gibt es heute in zahlreiche Geräte eingebaute elektronischen Stimmen: Das Telefon meldet, daß der Teilnehmer momentan nicht erreichbar sei, der Autofahrer wird gewarnt, wenn er nicht angeschnallt ist, im Lift sagt die Elektronik das Stockwerk an etc.

Doch so redselig, wie sie tönen, sind diese High-Tech-Maschinen auch wieder nicht. Ihre Stimmen verkünden lediglich elektronisch abgespeicherte Sprachsignale. Wenn der Textumfang nicht groß ist, diese Methode billiger und vor allem praktischer als die Tonbandtechnik: Sie braucht weniger Platz und keine komplizierte Wartung. Außerdem sind vollelektronische Stimmen praktisch sofort verfügbar, da das zeitraubende Positionieren des Tonbandes entfällt.

Statt ganze Sätze kann man auch nur Satzteile oder sogar Wortteile abspeichern und die Elektronik so programmieren, daß sie Ansagen von Fall zu Fall neu zusammensetzt.

Bei komplizierten Ausgabe texten ist es praktisch, die Meldungen nicht als Tonsignale, sondern geschrieben abzuspeichern - sie brauchen dann rund 1000mal weniger Speicherplatz. Die Umwandlung der geschriebenen Sprache in die gesprochene benötigt zwei Schritte: Zuerst muß der Text in Lautschrift umgesetzt werden (Transkription), anschließend erfolgt die Verkettung der Sprachelemente zu gesprochenen Sätzen (Sprachsynthese).

Die Transkription ist eine heikle Sache. So gibt es für dieselbe Buchstabenfolge oft unterschiedliche Ausspracheweisen, wie die Beispiele "täuschen" , "Häuschen" und "Werkschor" zeigen. Das Programm muß auch Abkürzungen richtig erkennen, und dafür sorgen, daß aus dem Herrn Newton nicht ein Herr Neffton wird. Der Verlauf der Betonung muß exakt festgelegt werden, sonst erkennt der Zuhörer das Satzende nicht, oder er kann Blumento-Pferde nicht von Blumentopf-Erde unterscheiden.

Bei der anschließenden Sprachsynthese genügt es nicht, einfach die nötigen Laute aneinanderzureihen. Denn je nach der Stellung bzw. der Betonung eines Sprachelementes innerhalb eines Wortes oder Satzes müssen seine Dauer, Tonlage und Lautstärke angepaßt werden.