Búsqueda de relaciones causales para aplicaciones en cardiología y psiquiatría

  1. Prado Cumplido, Mario De
Zuzendaria:
  1. Antonio Artés Rodríguez Zuzendaria

Defentsa unibertsitatea: Universidad Carlos III de Madrid

Fecha de defensa: 2012(e)ko urtarrila-(a)k 19

Epaimahaia:
  1. Aníbal Ramón Figueiras Vidal Presidentea
  2. Fernando Pérez Cruz Idazkaria
  3. Enrique Baca García Kidea
  4. Felipe Atienza Fernández Kidea
  5. Alberto Suárez González Kidea

Mota: Tesia

Laburpena

En esta tesis se presenta un estudio sobre la teoría de la causalidad y se desarrollan nuevas técnicas de inferencia causal en datos discretos y en señales continuas. Estos métodos se han utilizado para avanzar en el conocimiento de dos problemas médicos: uno en el campo de la psiquiatría y otro en cardiología. Los métodos clásicos para inferir relaciones causales a partir de muestras se basan en múltiples análisis de independencia estadística condicional. Estos métodos no dan buenos resultados cuando el número de variables aleatorias es elevado. Por el contrario, las técnicas de aprendizaje máquina son razonablemente robustas frente a problemas de alta dimensionalidad. Se han sustituido los test de independencia por una batería de clasificadores en el algoritmo de búsqueda causal propuesto. En la tesis se muestra cómo es posible identficar las relaciones causales en funci on del número de variables relevantes en una clasficaci on. Se ha ensayado con dos clasificadores, un k vecinos más próximos y una máquina de vectores soporte (SVM). Para aligerar la carga computacional impuesta por el gran número de clasificadores a entrenar, se ha recurrido a una permutación aleatoria para obtener la salida de problemas de menor dimensión a partir de máquinas entrenadas en dimensión superior. Se ha empleado la téccnica de remuestreo "bootstrap" para etapas intermedias de estos algoritmos. Para señales en tiempo continuo, el criterio de inferencia causal de Granger afirma que si una señal ayuda a la predicci on de otra, la primera tiene influencia causal en la segunda. El criterio se implementa comparando los residuos de modelos autorregresivos ARMA de las señales. La inferencia causal tipo Granger obtiene mejores resultados forzando dispersidad en los coeficientes del modelo. Con este objetivo, en la tesis se ha empleado una aproximación basada en SVM para el modelado autorregresivo (cSVARMA); adicionalmente, se ha desarrollado una versión multivariable del algoritmo cSVARMA, que supera las prestaciones del modelo unidimensional. La función de coste robusta de los algoritmos propuestos hace que se obtengan mejores resultados, especialmente en escenarios con ruido tipo impulsivo. Se presentan simulaciones con datos sintéticos comparando los métodos anteriores con los más relevantes en la literatura; los resultados validan el buen comportamiento de los algoritmos propuestos para identficar causalidad en datos discretos y en series temporales. La algoritmia desarrollada se ha aplicado a dos problemas médicos. En el problema psiquiátrico, se han estudiado los factores más relevantes relacionados con la repetición de intentos de suicidio. No existen modelos etiológicos de nidos para esta problemática. A partir de una base de datos de pacientes psiquiátricos, con información clíica y sociolóica, se han seleccionado las variables fuertemente relevantes y se ha generado su árbol causal. La interpretación del modelo permite generar nuevas hipótesis de trabajo. También se ha entrenado un clasificador con las variables causantes de la repetición de intentos de suicidio, que puede emplearse para valorar el riesgo de nuevos pacientes y prevenir otros intentos. En cardiología, se ha desarrollado una herramienta de representación de relaciones causales que permite identificar los mecanismos de generación y mantenimiento de fibrilaciones auriculares. Existen distintas hipótesis sobre esta patología, y cada una de ellas conlleva un tratamiento terapéutico distinto. Los métodos clásicos de análisis de estas señales, basados en las frecuencias dominantes de las ondas auriculares, presentan una importante limitación, pues usando únicamente la frecuencia no es posible identificar los focos y la manera de propagarse de los frentes de onda por el miocardio. Se ha recogido una base de datos de electrogramas de fibrilación auricular y se han aplicado a este problema los m étodos de inferencia causal desarrollados. Finalmente, se ha diseñado una herramienta de visualización de las interacciones causales, que puede servir de apoyo al médico en el estudio de estas arritmias. ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------