Neue Technologie kämpft mit Akzeptanzproblemen:

Für Sprachverarbeitung noch kein Käufermarkt

13.08.1982

STUTTGART - Die Anwender scheinen eher skeptisch. Lassen Marktprognosen für Sprachverarbeitungssysteme die Herstellerherzen auch höher schlagen, so ist der Einführungsgrad gegenwärtig noch gering.K.-P. Fähnrich und A. Fauser vom Fraunhofer-Institut für Arbeitswirtschaft und Organisation, Stuttgart, befassen sich mit der Frage, was die Sprachverarbeitung dem Anwender bringt.

Sprachein-/-ausgabe soll dort eingesetzt werden, wo die Arbeitsaufgabe relativ hohe Konzentration (Erfassung von Daten in großer Zahl) oder Mobilität (Qualitätskontrolle) erfordert. Wer das Telefon als Bindeglied zwischen Mensch und Maschine einsetzen will, ist mit Sprachein-/-ausgabe ebenfalls gut bedient.

Wie weit ist die Entwicklung der Technologie fortgeschritten? Für die Sprachausgabe existieren bereits Systeme, die bei sehr großem, aber immer noch begrenztem und fest vorgegebenem Wortschatz menschlicher Sprachqualität schon sehr nahekommen.

Im Verhältnis dazu ist die Spracheingabe noch nicht ganz soweit. Praktisch einsetzbare Systeme, von denen die besseren derzeit Erkennungsquoten zwischen 97 und 99 Prozent aufweisen, sind zur Zeit noch sprecherabhängig. Als Vokabular sind einige hundert Wörter möglich, wobei man jedoch die Höhe des tatsächlich benötigten Wortschatzes häufig überschätzt.

Für das Unternehmen letztendlich entscheidend ist die Frage, wie sich durch den Einsatz von Sprachein-/-ausgabe wirtschaftlicher Erfolg erzielen läßt.

- Sprachein-/-ausgabe erleichtert die direkte Kommunikation zwischen Mensch und Maschine.

- Umkodieren kostet Zeit und ist stärker fehlerträchtig. Schnellere Eingabe von Daten (etwa wegen weniger Blickwechsel) spart Zeit.

- Das mit seiner Infrastruktur schon vorhandene Medium Telefon kann (für Sprachausgabe jetzt schon) benutzt werden.

- Nicht zuletzt bieten sich neue Einsatzmöglichkeiten, beispielsweise für Topmanager, die selten bereit sind, eine künstliche Kommandosprache zu lernen und sich an eine Tastatur zu setzen.

Im beruflichen Bereich zeigen sich interessante Produkte derzeit etwa beim "speech filing" in der Textverarbeitung: Diktate und Korrekturanweisungen lassen sich per Sprache eingeben, digitalisieren und elektronisch an die Schreibkraft am Textverarbeitungssystem übermitteln. Hier ist derzeit im wesentlichen die reine Digitalisierung (mit entsprechendem Speicheraufwand) Trumpf.

Wesentliche Anwendungen, die derzeit auch schon realisierbar sind, zeigen sich, wenn die existierende Technologie in größere Systeme eingebaut wird (Steuerungen im CNC-Bereich oder bei Systemen zur Qualitätskontrolle). Ein jetzt schon heißer Markt für Sprachausgabe als Bedienerführung liegt dort, wo von lokalen Außenstellen mit in EDV ungeübten Benutzern Daten an einen zentralen Rechner übermittelt werden müssen. Nicht übersehen werden dürfen auch Anwendungen für Behinderte.

Statt auf digitalisierter Sprache Sprachausgabesysteme aufzubauen, wird man für einsatzreife Systeme in Zukunft natürlich klingende Sprache ausschließlich aus Phonemen künstlich erzeugen. Statt einzelner Wörter werden Wortgruppen und ganze, fließend gesprochene Sätze erkannt werden. Langfristig soll der Rechner Sprache nicht nur erkennen, sondern auch verstehen. Er ist dann in der Lage, nicht nur festzustellen, was der Sprecher sagt, sondern was er meint. Irgendwann einmal wird der "Haushaltsroboter", statt auf die Äußerung "Hier zieht's" mit "Stimmt" zu antworten, das Fenster schließen.

- Sprachein-/-ausgabe wird Humanisierung für den Benutzer und Rationalisierung für das Unternehmen bedeuten, auch wenn Sprache nicht für alle Anwendungen die ideale Kommunikationsform darstellt. In vielen Fällen wird erst die Symbiose von Sprache und Bild zum optimalen Ergebnis führen.

- Die Technologie ist für eine ganze Reihe von Anwendungen praxisreif entwickelt. Für weitere Anwendungen gilt es oft, die richtigen Algorithmen erst noch zu finden.

- Die Wirtschaftlichkeit muß im konkreten Anwendungsfall genau geprüft werden: Noch ist die Sprachein-/-ausgabe ein Anbieter- und kein Käufermarkt.

- Der Sprach-Chip ist nicht die Problemlösung. Der Erfolg kommt, wenn komplette Anwendungen daraus gemacht werden.