Speech Application Language Tags (Salt) veröffentlicht

Standard für Sprachanwendungen auf mobilen Endgeräten

16.08.2002
MÜNCHEN (fn) - Eine Reihe von Firmen hat eine Spezifikation für sprachengestützte Anwendungen veröffentlicht. Die Speech Application Language Tags (Salt) eignen sich dazu, Web-Seiten um spezielle Auszeichner (Tags) für Sprachein- und -ausgabe sowie Anrufkontrolle zu erweitern. Konzipiert wurde Salt für mobile Endgeräte.

Mit Salt können Funktionen wie etwa die Umwandlung von Text in Sprache (Text-to-Speech), Sprachsteuerung von Anwendungsdialogen sowie das Management von Telefonverbindungen realisiert werden. Über den "Prompt"-Tag beispielsweise lassen sich Audiosequenzen oder synthetische Sprache abspielen. Andere Auszeichner wie "Listen" oder "Bind" sind für die Spracherkennung vorgesehen. Spezielle Anrufkontrollobjekte steuern das Öffnen von Telefonverbindungen, das Beantworten von Anrufen sowie deren Weiterleitung und Beendigung. Salt entstand in dem gleichnamigen Industrieforum (www.saltforum.org), zu dessen Gründern Cisco, Intel, Microsoft, Philips, Comverse und Speechworks zählen.

Multimodale Bedienung

Die Spezifikation beschränkt sich jedoch nicht auf die reine Sprachsteuerung, vielmehr zielt sie auf die Verknüpfung unterschiedlicher Eingabemöglichkeiten im Sinne einer multimodalen Benutzer-Schnittstelle. Der Anwender gibt dabei Sprachkommandos, nutzt aber gleichzeitig die Maus, Tastatur oder einen Zeigestift. Ebenso kann die Ausgabe per Sprache oder am Display erfolgen. Damit eignet sich Salt insbesondere für PDAs und Mobilfunktelefone.

Die Aktivitäten des Salt Forum verwundern insofern, als mit Voice XML, der Voice Extensible Markup Language, schon seit einiger Zeit eine Auszeichnungssprache existiert, deren zweite Version jüngst das Voice XML Forum veröffentlichte. Mit Letzterer können Unternehmen Telefonie- beziehungsweise Interactive-Voice-Response-Anwendungen entwickeln. Nach Darstellung des Salt-Mitbegründers Speechworks bestehe prinzipiell eine gewisse Konkurrenz zwischen beiden Ansätzen, da Salt auch zur Erstellung reiner Telefonieanwendungen taugt, falls die multimodale Komponente nicht implementiert wird. Allerdings handelt es sich bei Voice XML um eine Art Programmiersprache, während Salt lediglich eine Sammlung von Tags definiert, die sich in XHTML, HTML, XML oder ECMA Script einbinden lassen.

W3C führt zusammen

Es gibt Anzeichen einer Annäherung beider Entwicklungen. So überlegt man in der vor kurzem gegründeten W3C Multimodal Working Group, Teile der Salt- und Voice-XML-Spezifikation sowie einiger anderer Techniken zu verwenden.

Ein weiterer Unterschied zwischen beiden Ansätzen ist: Während das Salt Forum die Spezifikationen allen Mitgliedern kostenfrei zur Verfügung stellt, schließt das Voice XML Forum Lizenzgebühren nicht aus.