Analisis y síntesis de expresión emocional en cuentos leídos en voz alta

  1. Francisco, Virginia
  2. Gervás Gómez-Navarro, Pablo
  3. Hervás Ballesteros, Raquel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 35

Páginas: 293-300

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Un reto importante para los conversores texto-voz es conseguir que la voz sintética suene lo mas parecido posible a la voz humana. La voz generada por estos sistemas actualmente suena artificial y esta es la principal causa de rechazo por parte del público general. Para conseguir que el sintetizador aparente ¿vida¿ interesa generar voz con distintos estados anímicos. El desafío fundamental de la generación de voz emocional es tratar de generar una emoción suficientemente clara para que no haya confusión en el oyente. Existen muchas teorías para definir una escala emocional. La elección de una escala concreta determina las emociones que se pretenden distinguir. Otro desafío importante es analizar las características acústicas de los distintos estados emocionales para intentar posteriormente regenerar las mismas a través del sintetizador (Montero, 2003). Este trabajo se plantea explorar la viabilidad de modelar las cadencias propias de la narración de historias a través de los parámetros de control de un conversor texto-voz. Para lograr estos parámetros se realizará un análisis de material de audio emocional y una vez modeladas cada una de las emociones se realizará una evaluación del material obtenido