Selección de características para el reconocimiento de patrones con datos de alta dimensionalidad en fusión nuclear

  1. Pereira González, Augusto
Dirigida por:
  1. Sebastián Dormido Canto Director/a
  2. Jesús Antonio Vega Sánchez Director/a

Universidad de defensa: UNED. Universidad Nacional de Educación a Distancia

Año de defensa: 2015

Tribunal:
  1. Gonzalo Pajares Presidente
  2. José Sánchez Moreno Secretario/a
  3. Bernardo Zurro Hernández Vocal

Tipo: Tesis

Resumen

La mejora tecnológica en los sistemas de adquisición de datos facilita que la dimensionalidad de los datos y su almacenamiento crezcan continuamente. Los métodos de reconocimiento de patrones y las técnicas de selección de características tienen que adaptarse al incremento cada vez mayor de la información adquirida. La reducción de dimensionalidad se convierte en crucial para poder extraer información oculta y mostrar los resultados obtenidos al usuario final. En esta tesis se propone como principal contribución un método rápido de selección de características. Se fundamenta en la combinación de algoritmos genéticos, predictores probabilísticos y una función de ajuste basada en la diferencia entre tasas de aciertos y falsos positivos. Este método determina de forma rápida y precisa las variables que aportan más información para predecir con anticipación las disrupciones que suceden en el plasma del dispositivo de fusión termonuclear JET. Se facilita también una solución para localizar patrones similares en series temporales de señales digitalizadas. Se proponen búsquedas alternativas y flexibles que incrementan el reconocimiento rápido de formas de onda muy largas. Se presentan estrategias de búsqueda muy precisas en la detección de patrones sin influencia del tamaño de la base de datos y de la cantidad de los mismos. Todos estos métodos están operativos en el estellarator TJ-II y en el tokamak JET por medio de una herramienta de exploración que permite la visualización inmediata de formas de onda similares en señales de evolución temporal. Finalmente y como tercera aportación más relevante, se examinan y solucionan los problemas de comunicación de eventos que se producen durante el transcurso de la operación experimental del TJ-II. Se automatizan tareas de aprendizaje y clasificación que se ejecutan en equipos muy diferentes y remotos. Se suministran técnicas de sincronización entre procesos para plataformas y entornos muy heterogéneos, como pueden ser entre sistemas de tiempo real (OS9, VxWorks), sistemas de tiempo compartido (Unix, Linux) y aplicaciones JAVA. La presente tesis doctoral es el resultado aglutinador de la aplicación de una serie de técnicas originales y procedimientos analíticos relevantes, concernientes a la selección de características y la búsqueda de patrones, utilizando la enorme cantidad de información almacenada en las bases de datos de los dispositivos experimentales de fusión TJ-II y JET.