MWC

Löst Voice die Handy-Browser ab?

18.02.2009
Von 
Jürgen Hill ist Chefreporter Future Technologies bei der COMPUTERWOCHE. Thematisch befasst sich der studierte Diplom-Journalist und Informatiker derzeit mit aktuellen IT-Trendthemen wie KI, Quantencomputing, Digital Twins, IoT, Digitalisierung etc. Zudem verfügt er über einen langjährigen Background im Bereich Communications mit all seinen Facetten (TK, Mobile, LAN, WAN). 
Während Betriebssystemhersteller wie Microsoft versuchen, ihre Browser weiter zu verbessern, arbeiten andere Aussteller wie Nuance oder Materna an der Sprachsteuerung von Smartphones und Mobile Web.

Sprache als Eingabe- und Steuerungsmedium? Auf den ersten Blick klingt der Gedanke befremdlich. Beim zweiten Hinsehen beziehungsweise -hören hat er jedoch durchaus seinen Reiz. Denn ganz gleich wie stark die Gerätehersteller auch ihre Displays verbessern, die Sprache bleibt eigentlich das natürliche und primäre Medium eines Mobiltelefons.

Nuance

Und diese Medium versucht beispielsweise Hersteller Nuance Communications - eher in der Öffentlichkeit für seine PC-Diktiersoftware "Dragon Naturally Speaking" bekannt - sowohl zur Gerätesteuerung als auch für Anwendungen zu nutzen. Dabei fährt Nuance mit der neuen Software "Nuance Voice Control 2.0" (NVC) einen zweigleisigen Ansatz. Ein Teil der Spracherkennung findet direkt auf dem Endgerät statt, der Rest dagegen über das Netz auf zentralen Servern, die mit einer höheren Rechenleistung und damit besseren Erkennungsleistung als das Endgerät selbst aufwarten. Auf diese Weise ist der Benutzer in der Lage, direkt auf dem Endgerät sprachgesteuert Anrufe zu initiieren.

In Kombination mit den Servern im Hintergrund kann er ferner frei im Web per Sprache nach Inhalten suchen indem er Fragen wie "Suche spanisches Restaurant in Hannover" stellt. Ebenso ist die Suche nach Musiktiteln vorstellbar, die dann etwa gleich aus dem Musikstore eines Providers heruntergeladen werden könnten. Überdies ist eine Kopplung mit einem im Handy integrierten Navigationssystem möglich, so dass die Ortssuche akustisch eingegeben werden kann. Auf diese Weise lassen sich auch E-Mails oder SMS diktieren. Das Ganze funktionierte während einer Demonstration auf dem Mobile World Congress (MWC) auch in deutscher Sprache schon überraschend gut. Allerdings sollte der User Fehler korrigieren, denn die Spracherkennungs-Software "lernt" mit der Zeit dazu (ähnlich wie das Pedant am PC). Diese Analogie stammt daher, dass auch beim mobilen System im Backend die Sprach-Engine von Dragon läuft.

Offen ist allerdings noch, wann das System in Deutschland erhältlich ist. Zwar funktionieren Software und Spracherkennung mittlerweile auch in Deutsch, Nuance sucht aber noch einen Mobilfunk-Provider als Partner, der das System einführt. Auch für die Nuance-Neuvorstellung "Nuance Mobile Care 2.0" (NMC 2.0) gibt es noch keinen Termin in Sachen deutscher Markteinführung. Das System soll für den Verbraucher eine Art Self Service auf dem Mobiltelefon etablieren. Der Hintergedanke dabei ist, dass das Telefon selbst als First Level Support agiert und so der User nicht mit einem teuren Call-Center- Agent in Verbindung treten muss. Prepaid-Kunden könnten mit NMC, so eine Nuance-Demo, per Sprachbefehl etwa ihr Guthabenkonto abfragen und erhalten dann die entsprechende Information in Textform auf ihrem Handy. Nach Ansicht des Anbieters bietet das System zwei Vorteile: Für die Kunden ist es bequemer und einfacher als die kryptischen SMS-Kürzel zur Abfrage entsprechender Infos zu merken. Und für die Unternehmen, neben dem Beispiel Mobilfunk ist auch der Einsatz in anderen Branchen vorstellbar, hilft es Kosten zu senken, da direkte Anrufe bei der Hotline reduziert werden können.