Sprache als integraler Bestandteil der Unternehmenskommunikation (Teil 1)

Sprachverarbeitung: schlechtes Image - hohe Wirtschaftlichkeit

14.09.1990

Keine Frage, Sprachverarbeitung in einfacher Form ist heute schon integraler Bestandteil vieler Arbeitsabläufe in Büros aller Art. Was zu wünschen übrig läßt, ist die Integration der Sprache in andere bereits DV-gestützte Vorgänge. Peter Fidrich* legt in einer dreiteiligen Folge dar, was alles mit Sprachverarbeitung zu machen wäre.

*Dr.-Ing. Peter Fidrich, Unternehmens. beraten für Produktmarketing im Bereich der Kommunikation und Datenverarbeitung.

In den letzten fünfzehn Jahren sind viele Kommunikationsverfahren entwickelt und eingesetzt worden: Electronic Mail, Fax, Teletex, Btx und innerbetriebliche DV-Verfahren. Manche von ihnen - wie zum Beispiel Fax - haben sich in einer unerwarteten Weise durchgesetzt. Dennoch ist heute nach wie vor das Telefonnetz durch die enorme weltweite Verbreitung des Telefons mit über 500 Millionen Teilnehmern das weitaus bedeutendste Kommunikationssystem. Dennoch muß man feststellen, daß die potentiellen Möglichkeiten dieses Systems in keiner Weise ausgenutzt sind.

Die Vorteile des Telefons liegen auf der Hand. Die Sprache ist die natürlichste Form der Kommunikation, persönlicher und ausdrucksvoller als jeder Text. Die Benutzung des Telefons ist einfacher als die Texteingabe. Die Endgeräte sind überall verfügbar.

Allerdings sind auch die Nachteile nicht zu übersehen: Telefonanrufe stören oft den Angerufenen. Der Gesprächsteilnehmer ist nicht immer erreichbar. Häufig muß der gewünschte Teilnehmer erst geholt werden.

Der Gebrauch des Telefons ist - bis auf die Nutzung von einigen Leistungsmerkmalen wie Rückruf, Kurzwahl oder Wahlwiederholung - im Verlauf der Jahre nahezu gleich geblieben.

In den Achtziger Jahren sind Produkte auf den Markt gekommen und zum Teil erfolgreich eingesetzt worden, die die Nutzungsmöglichkeiten des Telefonsystems enorm ausweiten; sie werden unter den Begriffen "Sprachverarbeitung" oder "Voice Processing" zusammengefaßt.

"The voice processing industry offers oceans of opportunity, vast unexplored waters, and hundreds of applications and customers yet to be discovered" (Dataquest 1989).

Der Einsatz dieser Produkte könnte zu gravierenden Veränderungen bei der Abwicklung von Geschäften, dem Kaufen und Verkaufen von Produkten führen: Das betrifft das Speichern und Versenden von Sprachmitteilungen und damit das Kommunizieren mit nicht anwesenden Teilnehmern, das automatische Auslösen von Anrufen bei Notfällen, das sprachgesteuerte Aufnehmen von Analysen, wie zum Beispiel die Unterstützung bei der Auswertung von Röntgenbildern, den Zugriff auf den im Computer gespeicherten Kontostand über das Telefon etc.

Es wird geschätzt, daß der Umsatz in den USA für die Sprachverarbeitung einschließlich Services bereits 1988 650 Millionen Dollar betrug. Das Wachstum lag bei 50 Prozent. In Deutschland befindet sich der Markt noch in einem sehr frühen Stadium, 1988 betrug sein Volumen zirka 20 Millionen Mark; dementsprechend ist der Umsatz noch äußerst gering. Es wird jedoch ein überdurchschnittliches Wachstum prognostiziert.

Was ist eigentlich Sprachverarbeitung?

Die Kommunikation zwischen Menschen erfolgt mit Hilfe der Sprache direkt; zwischen Menschen und Maschinen bei Daten und Images jedoch indirekt oder zeitversetzt.

Die zeitversetzte Mensch/Maschine-Kommunikation für die Sprache im Sinne der Sprachverarbeitung wurde bisher noch kaum effizient genutzt.

Die Sprachverarbeitung wir t in drei verschiedene Richtungen:

1. Verarbeitung von Sprachmitteilungen durch Verändern, Versenden, Ergänzen, Weiterleiten, Beantworten

2. Zugriff auf Datenbestände im Host und Unterstützung des Dialogs Telefon/Host mit phonetischer Führung und Sprachausgabe. Hierfür ist eine Eingabe mit MFV- (Mehrfrequenzverfahren)Tastatur oder Spracherkennung notwendig

3. Einbeziehung der Kommunikation von Images wie zum Beispiel Fax durch

- Anzeige von angekommenen Images über Spracheingaben - Bestätigung von Dateneingaben wie zum Beispiel Bestellungen oder Anfragen durch das Aussenden von Fax (siehe Bild 1)

Die verschiedenen Anwendungen werden mit VOICE SERVERN oder SPRACHSERVERN realisiert.

Andere Begriffe für Teilbereiche der Anwendungen sind: Voice Mail/Sprachspeicher/ Sprachinformations-Systeme.

Anwendergruppen und Funktionen

Es gibt einfache Funktionen der Sprachverarbeitung, die von jedermann, den "öffentlichen Nutzern", ohne Kenntnis der Abläufe, genutzt werden können. In der Regel ist hier eine Steuerung der Anwendung nicht notwendig, da die Anwahl des jeweiligen Services ausreicht (A).

Andere oder weitergehende Funktionen sind nur für die im Service "eingetragenen Benutzer" zugänglich. Diese sind mit den Abläufen vertraut und gehören meistens zu geschlossenen Benutzergruppen. Diese Benutzer sind Personen, die dem Service namentlich bekannt sind, ein eigenes "Postfach" oder Zugriff auf individuelle Informationen haben. Sie müssen sich für die Nutzung durch einen Zugangscode identifizieren und steuern den Ablauf durch Kommandos (B).

Die unterschiedlichen Personengruppen haben natürlich auch einen erheblichen Einfluß auf die jeweiligen Benutzeroberflächen (siehe Bild 2).

Anruferservice

Anrufe werden bei Abwesenheit oder auch im Besetztfall in das zugeordnete Postfach eines Benutzers umgeleitet. Der Anrufer A wird von dem Inhaber des Postfachs B begrüßt und kann dort eine Mitteilung hinterlassen (siehe Bild 3).

Eine Steuerung der Aufzeichnung ist nicht möglich. Gegebenenfalls wird der Anrufer, falls er nicht zu sprechen beginnt, gefragt, ob er mit dem Vermittlungsplatz oder dem Vertreter des Angerufenen verbunden werden will. Hierfür ist mindestens ein Sprachschalter (Pegelerkennung) notwendig (Ja oder ein Geräusch).

Der Inhaber eines Postfachs wird durch eine Signalisierung an seinem Telefon auf das Vorliegen von Mitteilungen aufmerksam gemacht. Er kann sie nacheinander abrufen (siehe Bild 4).

Gegenüber einem Anrufbeantworter unterscheidet sich ein Anruferservice durch eine hohe Integration mit anderen Diensten (siehe Bild 5):

- Gespeicherte Mitteilungen können von dem Empfänger A durch den Sprachmitteilungsservice in andere Postfächer mit oder ohne einen Kommentar weitergeleitet werden.

- Sofern die Telefonnummer des Anrufers als Etikett mitgesendet wurde, kann nach Abhören der Mitteilung eine Telefonverbindung durch die, Eingabe eines Kommandos hergestellt werden, bevor die nächste Mitteilung aufgerufen wird.

- Etiketten mit Namen des Absenders können durchgeblättert werden, sofern der Name des Anrufers mitgesendet wurde (bei ISDN) oder ermittelt werden kann (internes Telefonbuch der Telefonanlage).

- Komfortable Nutzung der Endgeräte beim Abhören der Mitteilungen.

- Persönliche Begrüßung in Abhängigkeit von internen und externen Anrufen beziehungsweise in Abhängigkeit vom Besetztfall oder bei Abwesenheit.

- Einbindung in übergeordnete DV-Anwendungen wie zum Beispiel im Hotel

- Phonetische Benachrichtigung beim Vorliegen eines Fax oder Electronic Mail.

Die Integration ist bei den verfügbaren Produkten in unterschiedlichem Maße realisiert. Beispiel für das Abrufen von Mitteilungen siehe Bild 6.

Mitteilungsservice

Öffentliche Nutzer können duch Anwahl des Servers und der Postfachadresse eines bestimmten Benutzers diesem eine Mitteilung direkt in seinem Postfach hinterlegen. Die Funktionsweise ist wie beim Anruferservice.

Der eingetragene Benutzer eines Sprachservers kann von jedem Telefon in der Welt in den Service hineinwählen, Mitteilungen abhören oder für andere Benutzer Mitteilungen in deren Postfach ablegen.

Dabei können beispielsweise auch Verteiler verwendet werden. Die Eingabe von Steuerdaten für die Anwendung und Adressen von Postfächern er. folgt durch MFV oder Spracherkennung (siehe Bild 7).

Interaktiver Datenservice

Bei dieser Anwendung ist der Sprachserver mit einem Host gekoppelt, so daß vom Telefon aus Daten in dessen Datenbank eingegeben oder von dort abgefragt werden können. Die Signalisierung kann durch MFV oder Spracherkennung erfolgen.

Der eingetragene Benutzer kann hier - nachdem er sich mit seinem Code identifiziert hat - ebenfalls Daten eingeben oder auf bestimmte Daten zugreifen. Im Gegensatz zum öffentlichen Nutzer hat der Benutzer durch seine Kenntnis des Services größere Möglichkeiten bei der Verwendung von Funktionen; darüber hinaus kann er auf vertrauliche Daten zugreifen (siehe Bild 8).

Informationsservice

In dem Sprachserver sind einzelne adressierbare Informationen gespeichert, die durch das Anwählen einer Telefonnummer abgehört werden können. In einer einfachen Form ist das ein Ansagedienst.

Die Informationen können auch in einer Baumstruktur gespeichert sein, so daß man durch bestimmte Eingaben über ein Menue Informationen nacheinander abgestuft abrufen kann (siehe Bild 9).

Benachrichtigungsservice

Hier können an interne oder externe Telefonteilnehmer einzeln oder über einen vorgegebenen Verteiler parallel Mitteilungen ausgesendet werden. Anwendung ist zum Beispiel das Alarmieren von Personengruppen. Das Auslösen der Funktion kann auch durch einen Host er. folgen, wenn ein Signalgeber eine bestimmte Veränderung der Situation anzeigt (zum Beispiel Einbruch), siehe Beispiel 10.

Eine entsprechende Nutzung erfolgt ebenfalls in Verbindung mit dem Sprachmitteilungsservice. Hier wird der Postfachinhaber unter einer von ihm angegebenen Telefonnummer angerufen, wenn eine Mitteilung in seinem Postfach abgelegt wurde. Er muß sich identifizieren und kann dann die Mitteilung abhören.

Automatische Vermittlung

Bei Anruf eines externen Teilnehmers bei dem Vermittlungsplatz wird dieser immer oder auch nur im Besetztfall von dem Sprachserver "empfangen". Dieser gibt ihm gegebenenfalls eine Information über den Grund des Wartens, gegebenenfalls ergänzt durch Informationen über das Unternehmen, bis die Verbindung herstellbar ist. Es ist auch möglich, daß der Anrufer über ein Menue die Möglichkeit erhält, sein Anliegen aufzusprechen oder mit einer bestimmten Abteilung verbunden zu werden (MFV oder Spracherkennung notwendig!). Durch eine Kopplung der Telefonanlage mit einem Host können gehende Telefonanrufe automatisch abgewickelt wer. den, wobei der Host nicht nur eine bestimmte Reihenfolge bei dem Aufbau von Verbindungen vorgibt, sondern auch simultan Kundeninformationen aus der Datenbank auf einer Datensichtstation zur Verfügung stellt. Der Sprachserver steuert hier den Verbindungsaufbau und unterstützt den Dialog durch Sprachausgaben. Eine vorstellbare Anwendung wäre die Ergänzung eines Telefongespräches mit einem Interessenten durch einen computergestützten Sprachdialog; bei diesem kann die Zufriedenheit des Kunden mit dein Produkt oder dem Produktangebot abgefragt werden, ohne daß der Sachbearbeiter damit beschäftigt ist.

Kommende Anrufe werden computerunterstützt auf die einzelnen Vermittlungsplätze nach bestimmten Vorgaben und Erfahrungswerten verteilt. Über Management Reports kann das Verkehrsaufkommen und seine Abwicklung im Detail verfolgt werden. Die Ressourcenplanung kann entsprechend durchgeführt werden.

Bei einem Anruf können über eine Host-Verbindung die Daten des Anrufers synchron auf einer Datensichtstation ausgegeben werden; die dazu notwendige Anruferidentifikation ist bei externen Teilnehmern erst mit ISDN möglich.

Der Sprachserver hat hier die folgenden Funktionen:

- Er begrüßt den Anrufenden und vermittelt diesen an den Sachbearbeiter oder Agenten.

- Im Besetztfall "unterhält" der Sprachserver den Anrufenden mit aktuellen Informationen über das Unternehmen oder die Produkte und bietet diesem gegebenenfalls an, seinen Wunsch oder sein Problem aufzusprechen; er wird dann umgehend zurückgerufen.

Unterschiedliche Marktentwicklung

Die Anwendung der Sprachverarbeitung in Deutschland ist relativ jung und beschränkte sich bisher auf eine begrenzte Anzahl von Einsatzfällen bei Sprachverarbeitungssystemen und der Spracherkennung.

Die Mißerfolge beim Einsatz von Sprachverarbeitungssystemen haben teilweise das Image dieser Produkte erheblich beeinträchtigt, obwohl sich diese durch eine extreme Wirtschaftlichkeit auszeichnen.

Dem entsprechend ist das Engagement der Anbieter gering und ihre Fähigkeit, solche anwendungsorientieren Produkte zu vermerkten, nicht besonders ausgeprägte

Im Gegensatz dazu wurden in den USA eine große Zähl unterschiedlicher Anwendungen erfolgreich realisiert; das trifft auch - wenn auch nicht im gleichen Umfang - für England zu.

Diese Einsätze betreffen nicht nur die Sprachverarbeitungs- oder Voice Mail-Systeme, sondern unter anderem auch die Verwendung des Telefons als Ein. und Ausgabegerät für das sogenannte "Home Banking" oder um individuelle Auskünfte abzuhören.

Unterstützt wird der Erfolg der Sprachverarbeitung in den USA dadurch, daß MFV-Telefone in großer Zahl verbreitet sind; zu dem sind in beiden Ländern Mobilfunksysteme und der sogenannte Shared Revenue Service stark eingesetzt, die beide einen großen Bedarf an Sprachverarbeitungssystemen und Spracherkennungsprodukten hervorgerufen haben.

Der Erfolg der Sprachverarbeitung wird davon abhängen, in welchem Maße Technologien kostengünstig und zuverlässig zur Verfügung stehen; insbesondere trifft das auf die Spracherkennung zu. Die fehlende Signalisierung bei der Eingabe über die Tastatur des Telefons kann nur durch MFV-Adapter oder besser noch durch die Spracherkennung überwunden werden, womit viele oder alle Anwender die Funktionen der Sprachverarbeitung nutzen können. (wird fortgesetzt)

Beispiel für einen Bedienungsablauf:

Der Inhaber des Postfachs hat den Sprachserver angewählt, sich identifiziert und hört die erste Mitteilung; Abrufen von Mitteilungen mit MFV-Eingabe (MFV-Eingabe eingerahmt mit + +).

Server, 1. Mitteilung: Frank Beier, Einkauf*. "Guten Tag, Frau Gerlach, hier ist Frank Beier, ich habe Ihnen mitzuteilen.............................."

Frau G.: + 2 + (für Herstellen der Telefonverbindung mit Herrn Beier) "Frank Beier"

Server: " Guten Tag, ich verbinde Sie mit Frau Gerlach"

"Guten Tag, Herr Beier".... Ende des Telefongesprächs

Server. "Für Löschen wählen Sie 6, für nächste Mitteilung 3"

Frau G.: + 3 +

Server, 2. Mitteilung: Ohne Absender "Guten Tag, Frau Gerlach" ..... usw.

* Name des Absenders wird automatisch eingesetzt

Bild 6: Beispiel für das Abhören von Mitteilungen

Beispiel für Bedienungsablauf:

Dialog zwischen dem Postfachbesitzer und dem Server mit Spracherkennung, nachdem dieser sich identifiziert hat:

Server: "Guten Tag, Herr Meier*, Sie haben drei neue Mitteilungen. Sagen Sie ,Hören' oder, Weiter'"

Meier: "Hören"

Server: "Mitteilung von Klaus Schulze* erhalten am Freitag, den..."

Meier: "Weiter"

Server: "Mitteilung von Herbert Fink* erhalten am Freitag, den 5.3 um 16 Uhr 40. Guten Tag Herr Meier, ich möchte Sie zu einer Besprechung am 11.3. um 14 Uhr einladen. Thema: Vertriebskooperation mit der Firma Cola. Bitte geben Sie mir Bescheid, ob Sie kommen können."

Server: "Sie können jetzt antworten oder..."

Meier: "Antworten"

Server: "Beginn der Aufnahme"

Meier: "Guten Tag Herr Fink......."', macht Pause

Server: "Sagen Sie ,Fortfahren' oder ,Ende...'"

Meier: "Ende"

Server: "Sagen Sie ,Weiter' oder ,Löschen"'

Meier: "Weiter"....... usw.

*Name des Absenders wird automatisch eingesetzt

Bild 7: Beispiel für die Bedienung des Sprachmitteilungsservices