VoiceXML
Aus 4webmaster.de
VoiceXML (Voice Extended Markup Language) ist eine XML-basierte Beschreibungssprache für Dialog-Abläufe in einem Sprachdialogsystem. Sie ist besonders für Telefonanwendungen entwickelt worden. Ziel ist, die grafischen Benutzerschnittstellen im WWW um die Ein- und Ausgabemöglichkeit der natürlichen Sprache zu erweitern und somit zu multimodalen Benutzerschnittstellen auszubauen. Seit März 2004 ist VoiceXML eine Empfehlung des W3C World Wide Web Consortium.
Eine Alternative zu VoiceXML ist SALT, eine von Microsoft initiierte HTML-Erweiterung. Multimodale Anwendungen – also die Verbindung von Sprache und grafischer Ausgabe – werden derzeit von VoiceXML nur begrenzt unterstützt. Es gibt jedoch Tendenzen, die multimedial angelegte Dialogbeschreibungssprache SALT mit VoiceXML zum neuen Standard XHTML+Voice (oder kurz X+V) zu vereinen. Dadurch würde diese Lücke geschlossen.
Entwicklungsgeschichte
Bei den ersten Sprachanwendungen gab es keine Trennung von Applikation und Plattform. Dialogverläufe wurden genauso „hart verdrahtet“ programmiert und kompiliert wie beispielsweise die Schnittstellen zur Telefonanlage. Das hatte zwar den Vorteil, dass Sprachanwendungen in der Regel schnell erstellt werden konnten und zuverlässig liefen. Der Preis dafür war eine für heutige Begriffe unakzeptable Starrheit. Sollte beispielsweise ein Dialog geändert werden, musste der Anwendungsprogrammierer Eingriffe tief im Quellcode vornehmen.
In neueren Sprachanwendungen wurde deshalb die Anwendung von der Plattform getrennt, so dass Dialoge einfacher gepflegt werden konnten. Jedoch waren (und sind es in vielen Fällen auch heute häufig noch) die Skriptsprachen oder Tools zur Beschreibung dieser Anwendungen proprietär – also von Anbieter zu Anbieter unterschiedlich.
VoiceXML ist eine Standisierungsanstrengung mit dem Ziel, zu einer einheitlichen Beschreibung von Sprachapplikationen zu kommen. Gleichzeitig ist es eine Schnittstellensprache, die zur Kommunikation zwischen Anwendung und Plattform genutzt werden kann. Der Standard hat mittlerweile eine weite Verbreitung gefunden und wird von zahlreichen Anbietern unterstützt, ohne allerdings den Markt völlig zu beherrschen. Neben den im Markt nach wie vor sehr verbreiteten proprietären Lösungen und Anwendungsplattformen gibt es konkurrierende Standardisierungsansätze, insbesondere den von einem Konsortium um Microsoft vorangetriebenen SALT-Standard.
Grenzen
VoiceXML als Skriptsprache zur Anwendungsentwicklung beruht auf dem Grundkonzept, dass sich Dialoge zwischen Mensch und Maschine über explizit vordefinierte Flussdiagramme formalisieren lassen. In dieser Vorstellung „navigiert“ der Anrufer durch den vordefinierten Dialogablauf, häufig sogar unter Verwendung expliziter Navigationskommandos wie »zurück« und »Hauptmenü«.
Dieses Konzept stößt dort an die Grenzen, wo sich die Interaktion einem freien Mensch-Maschine-Dialog annähert, bei dem den Anrufer die Dialoginitiative durch das Formulieren ganzer Sätze übernehmen kann, z.B. „nein, nach Hamburg, und zwar so, dass ich so gegen 18 Uhr da bin“ (sogenannte conversational oder mixed-initiative dialogues).
Zwar gibt es Konstrukte in VoiceXML, die dem Anrufer bei der Navigation durch den Dialogablauf gewisse Freiheiten eröffnen (z.B. sogenanntes form filling); der Aufwand für die Anwendungsentwicklung steigt jedoch prinzipbedingt mit zunehmender Freiheit im Dialogablauf drastisch an. Für die Realisierung solcher Dialoge erweist sich die Einführung eines sogenannten Dialogmanagers als nützlich, der die Systemreaktion dynamisch auf Basis der Dialoghistorie bestimmt. Ein solcher Dialogmanager kann allerdings genutzt werden, um VoiceXML-Dokumente - als Schnittstelle zur Sprachplattform - dynamisch zu generieren.
Siehe auch
- Dialog Design (Gestaltung akustischer Benutzerschnittstellen)
Weblinks
- W3C-Spezifikation von Voice XML 2.0
- Einführung in VoiceXML 2.0
- XHTML+Voice W3C Arbeitsentwurf deutsch
- CCXML derzeitiger Status: W3C Arbeitsentwurf
- VXIasterisk, VoiceXML interpreter for asterisk
- voice compass Portal für Herstellerübersichten zum Thema Voice und Sprachautomation
Dieser Artikel basiert auf dem Artikel VoiceXML aus der freien Enzyklopädie Wikipedia. Er steht unter der GNU-Lizenz für freie Dokumentation. In diesem Wiki und / oder der Wikipedia ist eine Liste der Autoren verfügbar.