Supercomputación aplicada para la identificación de patrones mediante clasificadores probabilísticos en diagnósticos de fusión

Martínez García, Francisco José

Supercomputación aplicada para la identificación de patrones mediante clasificadores probabilísticos en diagnósticos de fusión

Martínez García, Francisco José

Dirigida por:

Sebastián Dormido Canto Director/a
Jesús Antonio Vega Sánchez Director/a

Universidad de defensa: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 04 de julio de 2017

Tribunal:

Matilde Santos Peñas Presidenta
Rodrigo Castro Rojo Secretario/a
José Sánchez Moreno Vocal

Tipo: Tesis

Teseo: 498235 DIALNET e-spacio editor

Resumen

La tesis que se presenta tiene como escenario principal la supercomputación aplicada al descubrimiento de patrones, clasificación y confianza en la predicción. Los espectrogramas permiten el análisis tiempo-frecuencia de las señales de evolución temporal. Representan la magnitud de la transformada de Fourier dependiente del tiempo en función del tiempo. En fusión, una aplicación típica del reconocimiento de patrones puede ser la identificación de un patrón particular dentro de los espectrograma de varias señales de evolución temporal de la misma descarga. Esta búsqueda automática permite reducir los esfuerzos humanos para identificar y localizar eventos y estandarizar las búsquedas. Se han tenido en cuenta tres tipos de patrones básicos: señal con desviación de frecuencia lineal creciente (BPl), señal con desviación de frecuencia lineal decreciente (BP2) e intervalos con frecuencia constante (BP3). Estas tres estructuras básicas pueden combinarse y es posible reconocer todas las secuencias compuestas de cualquiera de los patrones básicos (BPI-BP2-BP3). Pero además del reconocimiento de estos patrones en el espacio tiempo-frecuencia, la técnica también permite la localización de las secuencias básicas y compuestas cuando aparecen con varios armónicos, es decir, el mismo patrón en las frecuencias más altas (una situación común en el análisis de Espectrogramas). La identificación y localización de los patrones en una amplia gama de descargas puede ser muy exigente en recursos computacionales y, por lo tanto, para acelerar el proceso, el software ha sido paralelizado e implementado en la plataforma Matlab paralela. La clasificación es uno de los campos importantes dentro del contexto de procesamiento de señales. En este sentido, el aprendizaje supervisado dispone de algoritmos para generar modelos capaces de realizar clasificaciones con alto porcentaje de acierto. Las maquinas de vectores soporte (SVM) se han convertido en una herramienta de referencia en el aprendizaje supervisado. No obstante los datos deben ser reducidos en dimensionalidad antes de entrar al modelo, pues solamente con una dimensionalidad adecuada se consiguen resultados efectivos de forma inmediata, por tanto este era otro de los objetivos de la tesis. La aplicación de algoritmos paralelos no es tan inmediata. Por este motivo fueron necesarias diferentes implementaciones de algoritmos paralelos para seleccionar el más adecuado para el proceso de clasificación de cinco tipos de señales del Estellarator TJ-II. En el campo de la predicción conformal el predictor Venn se muestra como un método que es capaz de generar y asignar ciertos niveles de confianza a cada una de sus predicciones en la clasificación. Se trataba pues de generar una taxonomía Venn-SVM capaz clasificar con niveles de confianza imágenes del sistema esparcimiento Thomson del TJ-II. A medida que las clases a las que se aplica la taxonomía Venn-SVM aumentan, los cálculos lo hacen a mayor velocidad lo que hace que el coste computacional sea elevado. Este es el motivo por el que la computación paralela es más necesaria en estos entornos. Previa reducción de dimensionalidad de cada imagen, se aplicaron los conocimientos adquiridos en aprendizaje automático para clasificar cinco tipos diferentes de imágenes del sistema de esparcimiento Thomson TJ-II.