NaturTtSMLUn esquema de anotación para la mejora de la naturalidad en los sistemas de síntesis de voz

  1. Albert González Lamaña 1
  2. Antonio Pareja Lora 2
  1. 1 Universidad Nacional de Educación a Distancia
    info

    Universidad Nacional de Educación a Distancia

    Madrid, España

    ROR https://ror.org/02msb5n36

  2. 2 Universidad Complutense de Madrid
    info

    Universidad Complutense de Madrid

    Madrid, España

    ROR 02p0gd045

Revista:
E-Aesla

ISSN: 2444-197X

Año de publicación: 2018

Número: 4

Páginas: 375-390

Tipo: Artículo

Otras publicaciones en: E-Aesla

Resumen

Aunque el resultado de los sistemas de conversión de texto a voz (CTV) actuales suele ser bastante inteligible, un CTV produce habitualmente una lectura monótona. Una de las principales causas de este problema es que un CTV no puede interpretar el contenido de un texto plano. Por lo tanto, para conseguir una lectura más expresiva y natural es necesario indicarle cómo debe leer el texto. Existen varios lenguajes y esquemas de anotación para este fin, pero parciales y/o centrados en diferentes aspectos del habla expresiva. Este artículo presenta un esquema de anotación (NaturTtSML) que reúne en uno solo los elementos principales de todos ellos.