Björn Klippstein

VoiceXML

Klippstein IT Service

Aus 4webmaster.de

Wechseln zu: Navigation, Suche

VoiceXML (Voice Extended Markup Language) ist eine XML-basierte Beschreibungssprache für Dialog-Abläufe in einem Sprachdialogsystem. Sie ist besonders für Telefonanwendungen entwickelt worden. Ziel ist, die grafischen Benutzerschnittstellen im WWW um die Ein- und Ausgabemöglichkeit der natürlichen Sprache zu erweitern und somit zu multimodalen Benutzerschnittstellen auszubauen. Seit März 2004 ist VoiceXML eine Empfehlung des W3C World Wide Web Consortium.

Eine Alternative zu VoiceXML ist SALT, eine von Microsoft initiierte HTML-Erweiterung. Multimodale Anwendungen – also die Verbindung von Sprache und grafischer Ausgabe – werden derzeit von VoiceXML nur begrenzt unterstützt. Es gibt jedoch Tendenzen, die multimedial angelegte Dialogbeschreibungssprache SALT mit VoiceXML zum neuen Standard XHTML+Voice (oder kurz X+V) zu vereinen. Dadurch würde diese Lücke geschlossen.

Entwicklungsgeschichte

Bei den ersten Sprachanwendungen gab es keine Trennung von Applikation und Plattform. Dialogverläufe wurden genauso „hart verdrahtet“ programmiert und kompiliert wie beispielsweise die Schnittstellen zur Telefonanlage. Das hatte zwar den Vorteil, dass Sprachanwendungen in der Regel schnell erstellt werden konnten und zuverlässig liefen. Der Preis dafür war eine für heutige Begriffe unakzeptable Starrheit. Sollte beispielsweise ein Dialog geändert werden, musste der Anwendungsprogrammierer Eingriffe tief im Quellcode vornehmen.

In neueren Sprachanwendungen wurde deshalb die Anwendung von der Plattform getrennt, so dass Dialoge einfacher gepflegt werden konnten. Jedoch waren (und sind es in vielen Fällen auch heute häufig noch) die Skriptsprachen oder Tools zur Beschreibung dieser Anwendungen proprietär – also von Anbieter zu Anbieter unterschiedlich.

VoiceXML ist eine Standisierungsanstrengung mit dem Ziel, zu einer einheitlichen Beschreibung von Sprachapplikationen zu kommen. Gleichzeitig ist es eine Schnittstellensprache, die zur Kommunikation zwischen Anwendung und Plattform genutzt werden kann. Der Standard hat mittlerweile eine weite Verbreitung gefunden und wird von zahlreichen Anbietern unterstützt, ohne allerdings den Markt völlig zu beherrschen. Neben den im Markt nach wie vor sehr verbreiteten proprietären Lösungen und Anwendungsplattformen gibt es konkurrierende Standardisierungsansätze, insbesondere den von einem Konsortium um Microsoft vorangetriebenen SALT-Standard.

Grenzen

VoiceXML als Skriptsprache zur Anwendungsentwicklung beruht auf dem Grundkonzept, dass sich Dialoge zwischen Mensch und Maschine über explizit vordefinierte Flussdiagramme formalisieren lassen. In dieser Vorstellung „navigiert“ der Anrufer durch den vordefinierten Dialogablauf, häufig sogar unter Verwendung expliziter Navigationskommandos wie  »zurück« und  »Hauptmenü«.

Dieses Konzept stößt dort an die Grenzen, wo sich die Interaktion einem freien Mensch-Maschine-Dialog annähert, bei dem den Anrufer die Dialoginitiative durch das Formulieren ganzer Sätze übernehmen kann, z.B. „nein, nach Hamburg, und zwar so, dass ich so gegen 18 Uhr da bin“ (sogenannte conversational oder mixed-initiative dialogues).

Zwar gibt es Konstrukte in VoiceXML, die dem Anrufer bei der Navigation durch den Dialogablauf gewisse Freiheiten eröffnen (z.B. sogenanntes form filling); der Aufwand für die Anwendungsentwicklung steigt jedoch prinzipbedingt mit zunehmender Freiheit im Dialogablauf drastisch an. Für die Realisierung solcher Dialoge erweist sich die Einführung eines sogenannten Dialogmanagers als nützlich, der die Systemreaktion dynamisch auf Basis der Dialoghistorie bestimmt. Ein solcher Dialogmanager kann allerdings genutzt werden, um VoiceXML-Dokumente - als Schnittstelle zur Sprachplattform - dynamisch zu generieren.

Siehe auch

Weblinks




Dieser Artikel basiert auf dem Artikel VoiceXML aus der freien Enzyklopädie Wikipedia. Er steht unter der GNU-Lizenz für freie Dokumentation. In diesem Wiki und / oder der Wikipedia ist eine Liste der Autoren verfügbar.





Persönliche Werkzeuge