BrowserVXML
Si tratta della applicazione che accetta in input i files VoiceXML e li esegue, alla stregua dell'interprete di un linguaggio di programmazione. Viene però detto browser in quanto lo scopo di VXML è quello di descrivere la modalità di interazione vocale nei confronti di un utente umano, così come l'HTML descrive la presentazione (e l'immissione di dati) di un utente che accede al Web.
Il browser VXML tipicamente opera sotto il controllo di un media server, connesso al canale audio (es VoIP) usato per accedere al servizio. Dato che il compito del browser è unicamente quello di interpretare le direttive presenti nei file XML, per poter parlare, a sua volta necessita dei servizi offerti dalle tecnologie di sintesi da testo e di riconoscimento vocale.
Una implementazione molto usata per il browser VoiceXML è
- OpenVXI - la versione 3.0 è del 2003, e questa è la sua documentazione
- reperibile anche su Sourceforge
- BladeWareVXML - afferma di essere una versione arricchita di OpenVXI, e il suo ultimo rilascio è del 2008. Il suo sviluppo è curato da Commetrex, ma dato che la documentazione a cui si riferiscono, è quella di OpenVXI versione 2.0.1, resta qualche dubbio.
- publicVoiceXML (2004) - non sembra differire di molto da OpenVXI, sebbene nella documentazione il problema dell'interfaccia con il TTS Festival sembrerebbe risolto in modo semplice
- Voiceglue - Dichiara di implementare le specifiche VXML 2.0 e in parte 2.1, è già predisposto per il TTS mediante il motore Flite, la riproduzione di file audio e il riconoscimento dei DTMF, nonché la registrazione dell'audio e un sistema di caching per gli output TTS più frequenti. Ora lo installiamo
Tra le altre implementazioni, citiamo
- VXI* - realizza un canale tra Asterisk e OpenVXI, ed un connettore HTTP universale verso TTS esterni
- Voxy - implementa un'interfaccia AGI (Asterisk Gateway Interface) e un browser VXML interno, mediante il quale esegue le pagine VXML e inoltra i comandi ad Asterisk. Da un primo sguardo ai sorgenti, non sembra aderire alle specifiche VXML 2.0, visto l'esiguo numero di comandi presenti nella routine di parsing. Dovrebbe consentire invece di interfacciarsi via HTTP (una cosa peraltro prevista dai form VXML) per eseguire script esterni (ad esempio: TTS, AVR e così via...)
- JVoiceXML - Un interprete VoiceXML in Java, che supporta API JSAPI and JTAPI
Trovo infine questo articolo: "Creating a low cost VoiceXML Gateway to replace IVR systems for rapid deployment of voice applications" pubblicato ad un congresso del 2006, in cui si racconta una success story con Festival, OpenVXI, Asterisk.
Categorie: SapienBlog
Pagine che puntano a questa: