CW-Produktübersicht Sprachverarbeitung:

Die Sprachverarbeitung kämpft noch mit vielen Problemen:

13.08.1982

MÜNCHEN - Eine Gleichung mit vielen Unbekannten ist derzeit noch die Verarbeitung der menschlichen Sprache durch EDV-Anlagen. Zumindest die Sprachausgabe aber schickt sich an, über das Stadium der sprechenden Spielautomaten hinaus für den technischen und kommerziellen Bereich interessant zu werden, die Spracherkennung jedoch steckt noch in den Kinderschuhen. Neben dem Problem, die Eingabe unabhängig vom Sprecher fehlerfrei zu erkennen, bereiten vor allem die Kosten und die geringe Verarbeitungsgeschwindigkeit des gesprochenen Textes den Forschern in den Labors noch Kopfzerbrechen. So beträgt beispielsweise das Verhältnis von Spracheingabe- und Verarbeitungszeit beim IBM-Produkt l: 200. das heißt. für einen 30 Sekunden langen Text benötigt der Rechner 100 Minuten, um die Eingabe zu verarbeiten. Haupteinsatzgebiete für die Sprachausgabe sind derzeit der Versandhandel großer Warenhäuser und die Ersatzteilbestellung in der KFZ-Branche. Bei der Sprecheridentifikation in Sicherheitsbereichen und bei anderen Kontrollfunktionen wie der Qualitätsprüfung in der Produktion finden Spracherkennungsprodukte derzeit noch ihre hauptsächliche Verwendung. Einen etablierten Mark1 im Bereich der Sprachverarbeitung gibt es noch nicht. So wurden die ersten Pilotprojekte in der Bundesrepublik erst vor rund zwei Jahren installiert. Das Gesamtumsatzvolumen beläuft sich gerade auf drei Millionen Mark, wovon die Siemens-Tochter Computergesellschaft Konstanz rund zwei Drittel innehat. Die folgenden Produktbeschreibungen sind ausschließlich Herstellermitteilungen entnommen. Die Übersicht erhebt keinen Anspruch auf Vollständigkeit.

Spracherkennung

Computergesellschaft

Modell: CSE

In der Lagerverwaltung, bei der Qualitätskontrolle und der Betriebsdatenerfassung sieht die Computergesellschaft Konstanz die Haupteinsatzgebiete ihrer Spracherkennungsserie CSE. Ferner ist auch die NC-Programmierung und die Robotersteuerung möglich.

In der Trainingsphase werden die Worte dem Eingabegerät drei- bis zehnmal vorgesprochen. Aus diesen so gewonnenen Bitmustern gewinnt das CSE-Modell einen Mittelwert, der als Referenzmuster in den Wortschatz aufgenommen wird. Die vom Benutzer gesprochenen Worte wandelt das Gerät in digitale Information um und vergleicht sie mit den abgespeicherten Bitmustern. Das Modell CSE 1030 hat eine Speicherfähigkeit von 80 Worten und kostet rund 12 000 Mark. Eine bessere Erkennungssicherheit und eine größere Kapazität (370 Worte) bieten die beiden Modelle 1050 und 1060. Ihre Preise liegen zwischen etwa 22 700 und 50 000 Mark.

Informationen: Computergesellschaft Konstanz, Max-Stromeyer-Straße 116, 7750 Konstanz, Tel.: 0 75 31/87-1.

Philips

Modell: Phides

Zur Überwachung der Zugangsberechtigung zu Sicherheitsbereichen ist das modular aufgebaute System Phides der Philips GmbH gedacht. Mit dieser Anlage ist eine automatiche Sprecherverifikation möglich. Daneben ist es auch bei der Geldauszahlung über Bankautomaten einsetzbar.

Die über ein Mikrofon eingegebenen Daten werden durch einen Analyseprozessor normiert und mit den abgespeicherten Daten verglichen. An das System können maximal 16 Terminals angeschlossen werden.

Das Eingangskontrollsystem besteht aus einem Mikrofon zur Spracheingabe, einem Tastenfeld für eine Identitätsvorgabe, dem Analyseprozessor zur Extraktion der Sprachmerkmale sowie einer Steuer- und Recheneinheit. Diese übernimmt die Ablaufsteuerung, die Musternormierung wie auch die Entscheidungsfindung.

Informationen: Philips Data Systems GmbH, Weidenauer Str. 211 - 213, 5900 Siegen 21, Tel.: 02 71/40 41.

GDV

Modell: VRT 300

Bei der Steuerung von Transportbändern oder Qualitätskontrolle in der Industrie, aber auch im wissenschaftlichen Bereich bei der Labordatenerfassung kann das Spracherkennungsmodul VON GDV eingesetzt werden. Das Produkt wurde speziell für das VT100-Terminal von DEC: konzipiert.

Das Gerät der Interstate Electronics Corp. erkennt bis zu 100 Worte oder kurze Ausdrücke, die dem VRT durch mehrmaliges Vorsprechen über ein Mikrofon eingegeben werden. Diese Worte analysiert das Modul und übersetzt sie in digitale Informationen. Neben der Vokabelgröße kann der Benutzer die Schallempfindlichkeitsgrenze und verschiedene Trainingsdurchläufe bestimmen. Spezielle Vokabeln oder Wortschatzuntermengen lassen sich neu eingeben, ergänzen oder durch andere Ausdrücke ersetzen. Das VRT 300 hat einen Preis von 3900 Mark.

Informationen: GDV Informationssysteme GmbH, Vor dem Kreuzberg 28, 7400 Tübingen,

Tel.: 0 70 71/2 43 21.

IBM Laborversuch

Ein IBM-Laborversuch befaßt sich mit dem Problem der Erkennung fließender Texte. Als Textmaterial verwenden die IBM-Leute dabei das Spezialvokabular von Patentanwälten. Der Wortschatz, den der verwendete /370-168-Rechner erkennen kann, umfaßt 1000 Worte. Bei den Vorleseversuchen arbeitete der Computer mit einer Genauigkeit von 91 Prozent.

In der Trainingsphase wird der Rechner auf die Sprachmuster eines bestimmten Redners trainiert, indem dieser die benötigten 900 Übungssätze in ein Mikrofon spricht. Zeitdauer: zwei Stunden.

Für einen 30 Sekunden langen gesprochenen Satz benötigt das /370168-Modell derzeit 100 Minuten Verarbeitungszeit, um den Text wieder ausgeben zu können.

Informationen: IBM Deutschland, Pascalstraße 100, 7000 Stuttgart 80, Tel.: 07 11/785-1.

Sprachvermittlung

Wang

Modell: DVX

Für den Anschluß an eine Fernsprechanlage mit Touch-Tone-Telefonen ist das digitale Sprachvermittlungssystem DVX entwickelt worden. Das Wang-Produkt zeichnet sogenannte Voicegram-(Sprachdiagramme-)Nachrichten auf, setzt diese in digitales Format um und speichert sie in einen "Audio-Briefkasten" ab. Dort können die Nachrichten anschließend von befugten Empfängern abgerufen werden.

Die zwölf Modelle des DVX-Systems unterscheiden sich in der Speicherkapazität der Platten und in der Anzahl der anzuschließenden Fernsprechleitungen. Die Palette reicht vom DVX-1 mit einem Plattenspeicher von 275 MB und einem Zugriff auf vier Telefonleitungen bis zum Modell DVX-12, das eine Kapazität von 1100 MB hat sowie die Vermittlung von zwölf Fernsprechleitungen bietet. Die einzelnen Modelle sind aufwärtskompatibel.

Informationen: Wang Deutschland GmbH, Lyoner Straße 26,6000 Frankfurt 71,

Tel.: 06 11/66 75-0.

Sprachausgabe

Votrax

Modell: LVM-80

Für die automatische Datenausgabe bei der Qualitätskontrolle, beim Materialtransfer in der Industrie, aber auch in der Forschung beim Ablesen von Instrumenten in schwer zugänglicher Umgebung (giftig, radioaktiv) ist das Votrax-Produkt einsetzbar.

Das Modell LVM-80 arbeitet nach dem Prinzip der digitalisierten Analogsprache. Die Speicherkapazität, die standardmäßig 16 Sekunden beträgt, kann auf 1000 Sekunden ausgebaut werden. Gleichzeitig kann das LVM-80 bis zu 64 Steuerimpulse empfangen und vier (erweiterbar auf 64) Ausgänge im Multiplexverfahren mit verschiedenen Texten versehen. Je nach Konfiguration kostet das Modell zwischen rund 25 000 und 160 000 Mark.

Daneben bietet Votrax noch andere Sprachausgabeprodukte an. So den SC-01-Chip, der mit 64 verschiedenen englischen Phonemen arbeitet. Der Preis liegt bei etwa 140 Mark.

Informationen: Votrax, Reisstraße 16, 6200 Wiesbaden, Tel.: 0 61 21/46 38 22.

MCS

Modell: MasCotS

Die Automobilbranche (Ersatzteilversorgung), der Buch- und Zeitschriftenhandel, Banken sowie der Versandhandel sind nach Angaben der MCS GmbH Einsatzgebiete ihres Sprachausgabesystems .

Die beiden Modelle des Systems (VRTA 16 und BP 16 B) werden über Akustikkoppler an das Telefonnetz angeschlossen.- Die Sprachausgabe erfolgt beim VRTA 16 über den Telefonhörer, während das BP 16 B einen eingebauten Lautsprecher besitzt. Der Benutzer kann über die Tastatur die benötigten Daten an den angeschlossenen Computer eingeben.

Dieser schickt die Resultate der Anfrage in sprachlicher Form zurück. Im Gegensatz zum VRTA-16-Modell besitzt das BP 16 B einen eigenen Datenspeicher mit einer Kapazität von 4000 Zeichen, wobei die Übertragungsgeschwindigkeit zehn Zeichen pro Sekunde beträgt.

Informationen: Menzies Communications Systems GmbH (MCS) Frankfurter Str. 168 - 176,6078 Neu-Isenburg Tel.: 0 61 02/3 80 54.

Racal-Milgo

Modell: CSA

Hauptsächlich im Bestellwesen, beispielsweise bei der Ersatzteilversorgung in der Kfz-Branche oder im Versandhandel, findet das Computer-Sprachausgabe-System (CSA) von Racal-Milgo Verwendung. Ferner kann es Schecks oder Kreditkarten überprüfen sowie Auskünfte oder aktuelle Tagesumsätze mitteilen.

Das System besteht aus einem kleinen, taschenrechnerähnlichen Gerät, das mit einem Akustikmuff an ein Telefon angeschlossen wird. Der Benutzer ruft per Telefon die gewünschte Stelle an und gibt über die Tastatur seine Daten wie Artikelnummer oder Stückzahl ein. Der Computer führt dann den Anrufer mit gesprochenen Hinweisen durch den Bestellvorgang. Gleichzeitig wird der Lagerbestand wieder aktualisiert.

Informationen: Racal-Milgo GmbH, Hans-Böckler-Str. 11, 6078 Neu-Isenburg, Tel.: 0 61 02/25 20.