Geringe Systemvoraussetzungen Capcad will Spracherkennung ueber Nischen hoffaehig machen

24.11.1995

MUENCHEN (ue) - Die Capcad Systems GmbH aus Aschheim bei Muenchen geht den noch jungen Markt fuer Spracherkennungssysteme ueber Nischenapplikationen an. Auf Basis von "Dragon-Dictate"- Algorithmen von der amerikanischen Dragon Systems Inc. haben die Bayern ressourcenschonende Spezialanwendungen fuer die Industrie und den Handel entwickelt.

Als Vorteil von Nischenapplikationen nennt Capcad den reduzierten Wortschatz, so dass sich eine deutliche Steigerung der System- Performance und Erkennungsrate erzielen laesst. Statt eines aktiven Vokabulars von mindestens 30000 Woertern, wie sie etwa die Bueroautomationsprodukte Dragon Dictate oder das Konkurrenzsystem "Voice Type" von IBM benutzen, kommt man bei "Capcad Speech System" (CCSS) meist mit einer Sammlung von 100 bis 300 Fachbegriffen aus.

Der Benutzer hat die Moeglichkeit, eine auf spezielle Aufgaben zugeschnittene Anwendung zu entwerfen und die dafuer benoetigten Ausdruecke zu editieren. Zwei aktuelle Capcad-Industrieprojekte stehen fuer typische Beispiele der Einsatzgebiete. In der Lackkontrolle eines Automobilherstellers wird derzeit eine Applikation getestet, bei der ein mit einem Funkmikrofon ausgestatteter Gutachter zur Qualitaetssicherung um das Fahrzeug geht und Schaeden registriert. Zum Wortschatz gehoeren in diesem Fall die Karosserie-Elemente und die moeglichen Schadensformen. Das Programm ist so strukturiert, dass es zum Beispiel nach dem Aufruf "Kotfluegel" in die Subroutinen Schadensart (Kratzer, Schramme etc.) und Schadensform (Laenge, Tiefe) wechselt.

Wenig Speicher fuer Minimal-Wortschatz

Das zweite Projekt laeuft in einem Verlagsgrosshandel und soll die Remittendenregistratur einer Lagerverwaltung unterstuetzen. Das Vokabular besteht hier lediglich aus den moeglichen Artikelbezeichnungen und der jeweiligen Menge. In beiden Faellen lassen sich die Protokolle direkt in die dafuer vorgesehenen Formulare diktieren.

Die Systemvoraussetzungen fuer CCSS sind im Vergleich zu den Allround-Produkten aufgrund der Spezialisierung relativ gering. Fuer die beschriebenen Anwendungen reicht ein 386-PC mit 16-Bit- Soundkarte. Die DOS-Version von Speech System belegt speicherresident 50 bis 60 KB. Unter Windows werden laut Hersteller je nach Wortschatz lediglich bis zu 4 MB RAM benoetigt. Zum Vergleich: Bei Voice Type empfehlen Experten 32 MB RAM, wenn ein sinnvolles Arbeiten moeglich sein soll. Ein Komplettsystem, bestehend aus Software, Mikrofon und IBM-Soundkarte, kostet knapp 2300 Mark.