Sprachportale: Service per Telefonanruf

08.07.2003
Von Ernst Maracke

Technisch bestehen Sprachdialogsysteme aus einer Voice Application Platform (VAP), die mit einer Telefonanlage verbunden ist. Die VAP enthält Komponenten für Spracherkennung und -synthese sowie für die Ausgabe und Aufzeichnung von Audiodateien. Ein Voice-Browser stellt die Kernkomponente ist her. Er interpretiert Inhalte, die dem Standard Voice XML folgen. Voice XML ist eine Spezifikation des W3C. In dieser Sprache wird der Ablauf eines Gespräches beschrieben. Das Design des Gesprächsablaufes ist einer der kritischen Erfolgsfaktoren für ein Sprachportal.

Alle Komponenten eines Dialogsystems, besonders die Spracherkennung, haben einen professionellen Reifegrad erreicht. Einem wirtschaftlichen Einsatz standen bisher hohe Hardwarekosten für entsprechend leistungsfähige Computer entgegen, ist nun aber kein Hinderniss mehr. Ein einfaches Sprachportal mit zwei Kanälen kann heutzutage auf einem handelsüblichen Personalcomputer betrieben werden.

Es gibt unterschiedliche Auffassungen darüber, ob sich ein Voice-Portale mit menschlicher oder synthetischer Stimme äußern soll. Die menschliche Stimme hört sich besser an, aber Umfragen zeigen, dass Anrufer auch eine synthetische Stimme akzeptieren. Es sollte vermieden werden, mit dem Abspielen von menschlicher Stimme zu versuchen, dem Anrufer zu suggerieren, er würde mit einer Person sprechen. Der Anrufer kommt mit hoher Wahrscheinlichkeit dahiner, ist enttäuscht und lehnt das System ab.

Entwicklung und Betrieb eines Systems, das mit Audiodateien arbeitet, verursachen zum Teil wesentlich höhere Kosten, besonders dann, wenn eine Vielzahl unterschiedlicher Äußerungen vorgehalten werden sollen.

Der weiterer Erfolgsfaktor ist der Umfang der Lösung. In manchen Anwendungsfällen ist es leicht möglich, mit einer einfachen Äußerung eine komplexe Antwort des Systems anzufordern. Das Problem ist nicht die Komplexität der Daten, Algorithmen oder Operatoren, sondern die Komplexität der Antworten. Niemand kann sich am Telefon komplexe Angaben merken oder vollständig verstehen. Dies ist insbesondere für Anwender ungünstig, die beispielsweise während einer Autofahrt ein Sprachdialogsystem nutzen.

Während die Einführung eines Sprachportals der eines klassischen IT-Projekts ähnelt, ist für das Gesprächsdesign ein eher prototypischer Ansatz erforderlich. Es hat sich bewährt, das von erfahrenen Dialogdesignern und in Labortests gefestigte Gesprächsdesign zunächst einer geschlossenen Benutzergruppe, beispielsweise Mitarbeitern, anzubieten, das System dabei sorgfältig zu analysieren und eventuelle Schwachstellen zu beheben. Analyse und Verbesserungen sind auch während des produktiven Betriebes notwendig.