Wer nicht sprechen will, muss tippen

24.10.2002
Von 
Alexander Freimark wechselte 2009 von der Redaktion der Computerwoche in die Freiberuflichkeit. Er schreibt für Medien und Unternehmen, sein Auftragsschwerpunkt liegt im Corporate Publishing. Dabei stehen technologische Innovationen im Fokus, aber auch der Wandel von Organisationen, Märkten und Menschen.
Vor Jahren galt die Spracheingabe am PC als innovatives und daher heißes Thema. Inzwischen sind die Programme jedoch aus dem Rampenlicht verschwunden. Das Problem liegt indes nicht im Computer, sondern sitzt davor.

Einst scheiterte der Siegeszug der einschlägigen Lösungen für die Konvertierung von Sprache in Text schlicht an der Hardware: Als Grundvoraussetzung musste ein schneller PC mit mindestens 64 MB Arbeitsspeicher zur Verfügung stehen. Vor Jahren war das selbst in Redaktionen der Computerpresse eine Ausnahme.

Heute, da bereits Grafikkarten mit 128 MB bestückt sind, hat sich diese Situation komplett gewandelt; dennoch ist es den einschlägigen Anbietern nicht gelungen, einen Paradigmenwechsel einzuleiten und die Tastaturen von den Schreibtischen zu verbannen. Nicht, dass Menschen von Natur aus gerne auf Plastiktasten tippen - die verfügbaren Programme sind ohne langes Training einfach kein adäquater Ersatz. Dabei sind die Tools inzwischen ausgereift. Nach einer Einarbeitungszeit von 45 Minuten sind "Viavoice 8" von IBM oder "Dragon Naturally Speaking" von Scansoft durchaus in der Lage, über die mitgelieferten Mikrofone simple Sätze richtig zu verarbeiten. Die Überraschung zumindest in der Anfangsphase ist

groß; man fühlt sich auf einmal verstanden.

Mit dem "Verstehen an sich" hat dies allerdings weniger zu tun - die Programme registrieren die akustischen Informationen und bilden sie nach bestem Wissen und Gewissen ab. Das wahre Problem sind die Anwender, die sich in der Regel nuschelnd durch die Welt bewegen. Dies wird prompt bestraft: Sagt man "wie", schreibt der Computer "sie". Immer wieder. Intensives Fluchen bringt einen in dieser Situation verständlicherweise auch nicht weiter, da es prompt von der Software dokumentiert wird.

Die Lektionen für das Training der Programme (und vor allem des Anwenders) sind aufwändig gestaltet. Nach einigen Testtexten hat sich der Rechner gemerkt, wie sein Nutzer bestimmte Begriffe auszusprechen pflegt. Danach ist dieses persönliche Profil systematisch zu verbreitern - Fehler dürfen nicht einfach per Tastatur korrigiert, sondern müssen dem Programm beigebracht werden. Diese Kleinarbeit kann lange Zeit dauern und stellt den Nutzer auf eine harte Geduldsprobe.

Fazit

Nach einer Woche regelmäßigen Trainings sollte man in der Lage sein, die umfangreiche Liste der Formatbefehle zu beherrschen. Steuern lässt sich mit den Tools nämlich fast alles, was in Word an Funktionen für die reine Textverarbeitung nötig ist. Darüber hinaus können mit den Programmen auch andere Anwendungen wie "Lotus Notes" oder der "Explorer" bedient werden. Wer Viavoice beherrscht, kann jedoch nicht einfach auf den Dragon umsatteln - die akustischen Anweisungen unterscheiden sich komplett: Mit dem Befehl "Mikrofon aus" lässt sich die IBM-Software deaktivieren; der Dragon hingegen hört auf die Order "Geh schlafen".

Die Programme

Viavoice Release 8 Standard

Anbieter: IBM

Listenpreis: 40 Euro

Vorteil: Woodrow, der sprechende Bleistiftstummel, liest Texte vor.

GUI: Typisch IBM.

Dragon Naturally Speaking XP Standard

Anbieter: Scansoft

Listenpreis: 99 Euro

Vorteil: Bietet keinen animierten Bleistiftstummel, sondern eine Frauenstimme.

GUI: Typisch Microsoft.