Utilización de métodos discriminantes en el modelado acústico de la voz

Díaz Pérez, Francisco

Utilización de métodos discriminantes en el modelado acústico de la voz

Díaz Pérez, Francisco

unter der Leitung von:

Pedro Gómez Vilda Doktorvater/Doktormutter

Universität der Verteidigung: Universidad Politécnica de Madrid

Jahr der Verteidigung: 1999

Gericht:

Antonio Pérez Ambite Präsident/in
María Mercedes Pérez Castellanos Sekretär/in
Joaquim Llisterri Boix Vocal
Enric Monte Moreno Vocal
Vicente Quesada Paloma Vocal

Art: Dissertation

Teseo: 73274 DIALNET

Zusammenfassung

Se analizan las posibilidades y deficiencias de los modelos ocultos de Markov para el modelado acústico, El objetivo es elevar las propiedades discriminantes de los referidos modelos para el reconocimiento del habla. Los estudios se enfocaron en tres direcciones: (1)Resalte de las características discriminantes contenidas en las plantillas espectrales mediante Análisis de Componentes Principales (PCA) y el análisis de discriminación lineal (LDA), (2) Implementación de la cuantización vectorial con métodos alternativos conexionistas (mapas autorganizativos, y capas competitivas), y además se sugiere una métrica de distancia vectorial; y (3) Desarrollo del entrenamiento discriminante de los modelos. Se concluye que el uso de la transformación realizada acorde al análisis de discriminación lineal, conjuntamente con la reducción de la dimensión y el entrenamiento discriminante, es una combinación muy adecuada para aumentar la eficiencia de los sistemas de reconocimiento de voz empleando modelos ocultos de Markov con funciones de probabilidades discretas. En los experimentos se mejora el método notoriamente el método clásico, pues en los conjuntos de entrenamiento de palabras aisladas y fragmentos vocálicos se alcanza el 97,92% y el 95,48% de aciertos, con una mejora de un 11,88% y de un 22,38% respectivamente; mientras que con los conjuntos de evaluación se obtienen el 83,33% y el 72,14% de aciertos en cada tarea, lo que supone una mejora del 7,61% y del 11,07% respectivamente.