Dev /

Festival

Motore di Text to Speech Open Source, sviluppato dall'Università di Edinburgo, sia come piattaforma comune a disposizione della ricerca sulla sintesi vocale, che per consentire la valutazione ed il confronto dei risultati, ed anche come prodotto finale da utilizzare da parte degli utenti finali. A questo, sono associate altre iniziative:

  • Festvox - una metodologia standard per dotare la sintesi vocale di nuove voci, ovvero per estenderne l'applicazione a nuove lingue
  • Flite - una versione ridotta all'osso di Festival, più idonea a funzionare dal lato server, o in dispositivi embedded. Usa le stesse voci disponibili per Festival, a patto di disporne nel formato di origine
  • Festival parla italiano - il sito di origine dove è distribuita la voce italiana
  • HOWTO: Make festival TTS use better voices - utili suggerimenti, anche per la ricompilazione

All'atto pratico

Nel realizzare il progetto Read My Feed?, ci siamo confrontati con diversi aspetti pratici legati al funzionamento di Festival, e ne riassumiamo qui alcuni

Installazione di Festival

Come impostare l'italiano, e le voci mbrola

Trascrizioni fonetiche ToBI

(Tones and Break Indicies): si tratta di una simbologia evocata nella documentazione di Festival, ma che resta elusiva. Ho trovato alcune pagine a riguardo:

Prima e dopo

Un file audio Δ per confrontare la pronuncia di alcune frasi di esempio, prima e dopo l'aggiunta delle nuove regole sviluppate

Categoria: SapienBlog


Pagine che puntano a questa: