Festival
Motore di Text to Speech Open Source, sviluppato dall'Università di Edinburgo, sia come piattaforma comune a disposizione della ricerca sulla sintesi vocale, che per consentire la valutazione ed il confronto dei risultati, ed anche come prodotto finale da utilizzare da parte degli utenti finali. A questo, sono associate altre iniziative:
- Festvox - una metodologia standard per dotare la sintesi vocale di nuove voci, ovvero per estenderne l'applicazione a nuove lingue
- Flite - una versione ridotta all'osso di Festival, più idonea a funzionare dal lato server, o in dispositivi embedded. Usa le stesse voci disponibili per Festival, a patto di disporne nel formato di origine
- Festival parla italiano - il sito di origine dove è distribuita la voce italiana
- HOWTO: Make festival TTS use better voices - utili suggerimenti, anche per la ricompilazione
All'atto pratico
Nel realizzare il progetto Read My Feed?, ci siamo confrontati con diversi aspetti pratici legati al funzionamento di Festival, e ne riassumiamo qui alcuni
Installazione di Festival
Come impostare l'italiano, e le voci mbrola
Trascrizioni fonetiche ToBI
(Tones and Break Indicies): si tratta di una simbologia evocata nella documentazione di Festival, ma che resta elusiva. Ho trovato alcune pagine a riguardo:
- ToBI Intonation Transcription Summary - più brevi di così non è possibile
- Ohio State University - presso il Departimento di linguistica, il ToBI viene definito, e vi si trovano riferimenti relativi alle lingue per le quali si è sviluppato
- Gli articoli originali di Silverman92 e Pitrelli94
- The new English ToBI Homepage - propone
- un link ad un Tutorial presso il MIT
- un corso completo di sonogrammi di esempio, e audio ascoltabile
Prima e dopo
Un file audio Δ per confrontare la pronuncia di alcune frasi di esempio, prima e dopo l'aggiunta delle nuove regole sviluppate
Categoria: SapienBlog
Pagine che puntano a questa: