Auf der Basis eines neuen statistischen Verfahrens:IBM präsentiert Spracherkennungssystem

20.03.1987

YORKTOWN HEIGHTS (pi) - Fortschritte im Bereich der Spracherkennung auf PC -Basis meldet die IBM. In Yorktown Heights wurde jetzt der Prototyp eines Wörterbuchs vorgestellt, das 20 000 Begriffe umfaßt und etwa 97 Prozent der üblichen Geschäftssprache abdecken soll.

Um von dem System richtig verstanden zu werden, sind bei der Spracheingabe über Mikrofon zwischen den einzelnen Wörtern kurze Pausen erforderlich. Die gesprochenen Eingaben werden auf dem Bildschirm angezeigt. Textdokumente lassen sich anschließend durch Eingabe über Stimme oder Tastatur editieren. Ebenso besteht die Möglichkeit, diese Schriftstücke zu speichern, zu drucken oder sie zu übertragen.

Da das System sprecherabhängig arbeitet, ist eine etwa zwanzigminütige Anpassung an die Besonderheiten des jeweiligen Benutzers nötig: In diesem Zeitraum liest der User ein bestimmtes Testdokument, das dem Rechner die Möglichkeit gibt, sich auf die individuellen sprachlichen Besonderheiten einzustellen.

Die Arbeitsweise des Spracherkennungssystems ist das Resultat eines statistischen Ansatzes, der gleichfalls im Thomas J. Watson Research Center entwickelt wurde: Eine begrenzte Anzahl von elementaren Bausteinen bildet die Grundlage des Verfahrens. Wenn ein Sprecher Wörter eingibt, wählt das System anhand des statistischen Modells sogenannte Wort - Kandidaten aus.

Weitere Spracheingaben führen dazu, daß bereits ermittelte Wort - Kandidaten im Kontext mit neuen Eingaben ausgewertet werden. Dieses kontextorientierte Vorgehen

ermöglicht dem System eine Unterscheidung zwischen Wörtern, die zwar ähnlich klingen, in ihrer Bedeutung jedoch differieren. Auch Satzzeichen werden verbal eingegeben.

Die künftigen Pläne der IBM - Forschungsgruppe sehen vor, den Prototyp in den eigenen Büros zu testen. Ferner soll die Entwicklung soweit vorangetrieben werden, daß die Pausen zwischen den einzelnen Wörtern wegfallen können.