Sprachportale: Service per Telefonanruf

08.07.2003 von Ernst Maracke
MÜNCHEN (COMPUTERWOCHE) - Mit Sprachportalen können Firmen Informationen und Services für Kunden anbieten, die lediglich über ein Telefon verfügen. Die Diaglogsteuerung kann über die Sprache erfolgen und ist viel benutzerfreundlicher als Touch-Tone-Systeme.

Noch haben sie keinen vernünftigen Namen. Sie werden Sprach- oder Voice-Portale, natürlichsprachliche Dialogsysteme, Sprachdialogsysteme, Voice- oder Speech-User-Interface oder sonst wie genannt. Aber es geht immer um dasselbe: Um die Automatisierung von Telefondiensten und Call-Center-Agenten. Der wirtschaftliche Vorteil für den Betreiber ist offensichtlich: Immense Kostenvorteile, einfaches Management von Leistungsspitzen, Realisierung von Rund-um-die-Uhr-Services ohne zusätzliche Kosten oder behördliche Genehmigungen und gleich bleibende Servicequalität, auch nach dem tausendsten Gespräch und tief in der Nacht.

Unabhängige Untersuchungen haben gezeigt, dass sich etwa 70 Prozent aller Telefondienste so automatisieren lassen und dabei Kostenvorteile von bis zu 90 Prozent realistisch sind. Sie zeigen auch eine große Akzeptanz bei den Anrufern. Zu einem überraschend großen Teil wird sogar angegeben, lieber mit einem Sprachportal als mit einem Call-Center-Agenten zu sprechen.

Ein Telefondienst lässt sich auf unterschiedliche Weise realisieren: Als Call-Center mit menschlichen Agenten, als Touch-Tone-System oder als natürlichsprachliches Dialogsystem. Touch-Tone-Verfahren sind weniger beliebt als Sprachdialogsysteme, da sie in der Bedienung umständlicher sind. Der Anwender muss Ansagen abwarten und spezielle Tasten drücken. Diese Systeme lassen sich durch Sprachdialoge ersetzen.

Ein automatisches Sprachdialogsystem kann ist allerdings kein vollwertiger Ersatz für einen Call-Center-Agenten. Schlagfertigkeit sowie Einfühlungsvermögen lässt sich einer Dialoglösung nicht beibringen. Telefonate, in denen die menschliche Bindung eine wichtige Rolle spielt, können nicht automatisiert werden und sind auch in absehbarer Zukunft immer von Menschen auszuführen. Beispiele für solche Dienste sind Verkaufsgespräche, medizinische Beratungsdienste und Seelsorge.

Dennoch gibt es viele Services, bei denen ein Sprachdialogsystem ausreichen würde, etwa Auskunfts-, Reservierungs-, Buchungs- und Bestellsysteme, der Zugriff auf persönliche Daten wie E-Mails, Sprachnachrichten, Terminkalender oder die Weitervermittlung von Telefonanrufen.

Technisch bestehen Sprachdialogsysteme aus einer Voice Application Platform (VAP), die mit einer Telefonanlage verbunden ist. Die VAP enthält Komponenten für Spracherkennung und -synthese sowie für die Ausgabe und Aufzeichnung von Audiodateien. Ein Voice-Browser stellt die Kernkomponente ist her. Er interpretiert Inhalte, die dem Standard Voice XML folgen. Voice XML ist eine Spezifikation des W3C. In dieser Sprache wird der Ablauf eines Gespräches beschrieben. Das Design des Gesprächsablaufes ist einer der kritischen Erfolgsfaktoren für ein Sprachportal.

Alle Komponenten eines Dialogsystems, besonders die Spracherkennung, haben einen professionellen Reifegrad erreicht. Einem wirtschaftlichen Einsatz standen bisher hohe Hardwarekosten für entsprechend leistungsfähige Computer entgegen, ist nun aber kein Hinderniss mehr. Ein einfaches Sprachportal mit zwei Kanälen kann heutzutage auf einem handelsüblichen Personalcomputer betrieben werden.

Es gibt unterschiedliche Auffassungen darüber, ob sich ein Voice-Portale mit menschlicher oder synthetischer Stimme äußern soll. Die menschliche Stimme hört sich besser an, aber Umfragen zeigen, dass Anrufer auch eine synthetische Stimme akzeptieren. Es sollte vermieden werden, mit dem Abspielen von menschlicher Stimme zu versuchen, dem Anrufer zu suggerieren, er würde mit einer Person sprechen. Der Anrufer kommt mit hoher Wahrscheinlichkeit dahiner, ist enttäuscht und lehnt das System ab.

Entwicklung und Betrieb eines Systems, das mit Audiodateien arbeitet, verursachen zum Teil wesentlich höhere Kosten, besonders dann, wenn eine Vielzahl unterschiedlicher Äußerungen vorgehalten werden sollen.

Der weiterer Erfolgsfaktor ist der Umfang der Lösung. In manchen Anwendungsfällen ist es leicht möglich, mit einer einfachen Äußerung eine komplexe Antwort des Systems anzufordern. Das Problem ist nicht die Komplexität der Daten, Algorithmen oder Operatoren, sondern die Komplexität der Antworten. Niemand kann sich am Telefon komplexe Angaben merken oder vollständig verstehen. Dies ist insbesondere für Anwender ungünstig, die beispielsweise während einer Autofahrt ein Sprachdialogsystem nutzen.

Während die Einführung eines Sprachportals der eines klassischen IT-Projekts ähnelt, ist für das Gesprächsdesign ein eher prototypischer Ansatz erforderlich. Es hat sich bewährt, das von erfahrenen Dialogdesignern und in Labortests gefestigte Gesprächsdesign zunächst einer geschlossenen Benutzergruppe, beispielsweise Mitarbeitern, anzubieten, das System dabei sorgfältig zu analysieren und eventuelle Schwachstellen zu beheben. Analyse und Verbesserungen sind auch während des produktiven Betriebes notwendig.

Aus technischen Gründen steht einem Einsatz von Sprachportalen nichts entgegen. Bevor jedoch eine Entscheidung für eine solche Lösung fällt, sollte ein Unternehmen analysieren, ob sich der Dienst für Sprachportale eignet. Der Aufwand eines professionellen Gesprächsdesigns ist abzuschätzen, insbesondere hinsichtlich der Komplexität. Während im Backoffice oft vorübergehende Abstriche in Funktionalität, Performance und Benutzbarkeit duldbar sind, muss das Gesprächsdesign von Anfang an die bestmögliche Qualität bieten.

Unternehmen sollten beginnen, sich das für Entscheidungen erforderliche Wissen in Seminaren oder aus der Literatur zu beschaffen. Die Services des eigenen Unternehmens sollten hinsichtlich der Automatisierbarkeit durch Sprachportale bewertet werden. Solange noch keine eigenen Erfahrungen bestehen, sollte ein mit Technologie und Projekten erfahrenes Beratungsunternehmen hinzu gezogen werden. Einen Einstieg bietet zum Beispiel die Website Speechuserinterface.de.

In vielen Fällen werden die Kostenvorteile und die Ausweitung der telefonischen Erreichbarkeit genügend Vorteile für ein Sprachportal bieten, um schließlich mit Investitionen in diesem Bereich zu beginnen.