Web

Intel-Software liest von den Lippen

29.04.2003

MÜNCHEN (COMPUTERWOCHE) - Intel hat eine Software entwickelt, die die Qualität von Spracherkennung verbessern soll. Die unter Open-Source-Lizenz veröffentlichte AVSR (Audio Visual Speech Recognition) nimmt neben Sprachbefehlen auch die Lippenbewegungen des Anwenders auf und synchronisiert die Daten. Dadurch lässt sich laut Intel die Genauigkeit der Spracherkennung vor allem in geräuschintensiven Umgebungen deutlich steigern.

Bild: Intel
Bild: Intel

AVSR ist Teil der "OpenCV Computer Vision Bibliothek". Die Toolbox, die seit knapp drei Jahren verfügbar ist, bietet rund 500 Bildverarbeitungsfunktionen, mit deren Hilfe sich bilderkennende Applikationen entwickeln lassen. Laut Justin Rattner, Direktor des Intel Microprocessor Research Labs, ist das Ziel der Entwicklung, Computer auf natürliche Art mit der Umgebung interagieren zu lassen. Dazu sei es notwendig, unterschiedliche Informationsarten zu kombinieren. Durch die Kapazität moderner Prozessoren, sinkende Preise für Digitalkameras und hohe Bandbreiten bei der Videoaufzeichnungen durch Technologien wie USB 2.0 (Universal Serial Bus) sei es möglich, auch mit Hilfe konventioneller PCs bilderkennende Algorithmen in Echtzeit auszuführen.

Der Quellcode von OpenCV ist in "C" geschrieben und steht Entwicklern mit kostenloser Redistributionslizenz zur Verfügung. Wer der OpenCV-User-Group beitreten will, kann sich unter groups.yahoo.com registrieren. (lex)