Erkennungssystem von Siemens und Philips mit 1000 Begriffen:

Spicos versteht Sich auf natürliche Sprache

13.02.1987

MÜNCHEN/HAMBURG (sch) Das Spracherkennungssystem Spicos hat jetzt nach mehrjährigen Forschungs- und Entwicklungsaktivitäten "die Ohren gespitzt". Die von Siemens und Philips unter Beteiligung des Institut voor Perceptie Onderzoek, Eindhoven, konzipierten Module erlauben es, Benutzeranfragen fließend in ein Mikrophon zu sprechen.

Mit der sich allerdings erst in der Experimentierphase befindlichen Anlage zur Verwaltung von Aktennotizen, Briefen und ähnlichen Schriftstücken wird eine Anfrage zunächst elektroakustisch analysiert und dem Erkennungsmodul zugeführt. Spicos - die Buchstaben stehen für die beiden Hersteller, das niederländische Institut und "continuous speech" - umfaßt derzeit ein Vokabular von ungefähr 1000 Begriffen. Dabei müssen Fragesätze und Anweisungen bestimmten Satzmustern entsprechen, die aus 200 typischen Anfrage-Beispielen hergeleitet worden sind.

Bei Verwendung des vorgegebenen Wortschatzes lassen sich insgesamt 1,5 Billionen individuelle Sätze von dem Dialogsystem erkennen und analysieren. Akzeptiert werden bisher einfach strukturierte "Geradeheraus"-Fragen mit dem "großen W" am Anfang. Auf umgangssprachliche Wendungen ist Spicos gegenwärtig noch nicht eingestellt.

Das System arbeitet sprecherunabhängig, daß heißt, für jeden Benutzer ist ein individuelles Training erforderlich, wobei Lautmerkmale der Phoneme aus Sprachproben ermittelt werden. Nach Aussagen des Sprachverarbeitungsexperten Hartmut Runge bei Siemens dauert die Lernphase für einen Anwender im Gegensatz zu den bereits auf den Markt gekommenen Worterkennungssystem nur kurz: "Es genügt, wenn man vier bis fünf gesamte Sätze vorspricht."

Die Erkennung wird durch ein Aussprache-Lexikon aller möglichen Wörter unterstützt. Durch Vergleich akustischer Eigenschaften der gesprochenen Wörter alt denen von Referenzmustern und durch statistische Methoden erzeugt Spicos Wortbeziehungsweise Satzhypothesen und reicht sie dann zur Weiterverarbeitung an ein linguistisches Analyse-Modell weiter. Dabei werden grammatisch korrekte Strukturen aufgebaut und zur Ermittlung der Satzbedeutung in semantische Bäume transformiert. Im Anschluß daran bestimmt ein Dialogmodul den Satztyp, führt die Datenbankabfrage durch und generiert eine Systemantwort. Diese Antwort wandelt Spicos dann in einen natürlichsprachlichen Satz um und gibt ihn entweder als Schrift auf dem Bildschirm oder über das Sprachsynthese-Modul mit angeschlossenem Lautsprecher akustisch aus. Das Experimentalsystem ist in Fortran geschrieben und basiert auf einem VAX-Rechner.

Die Dialogstruktur im Spicos-System erlaubt noch keine Rückfragen des Systems an den Benutzer, beispielsweise Aufforderungen zur -Wiederholung nicht-identifizierter Wörter oder zur Präzisierung der Fragen sowie die Bezugnahme auf vorhergehende Dialogteile.

Die Ausweitung des Wortschatzes und der Dialogmöglichkeiten sowie die Verbesserung der Sprachsynthese und die Reduzierung der Verarbeitungszeiten sind Forschungs- und Entwicklungsziele, die im nächsten Schritt bearbeitet werden. Finanziell gefördert wird das Spicos-Projekt vom Bundesministerium für Forschung und Technologie (BMFT) vom niederländischen Wirtschaftsministerium.