Diagnóstico y pronóstico en bases de datos clínicas con tecnicas no supervisadas. Diagnosis ano prognosis in clinical databases through unsupervised statistical techniques

  1. SÁNCHEZ RICO, MARINA LUCÍA
Dirigida por:
  1. Nicolas Hoertel Director/a
  2. Jesús María Alvarado Izquierdo Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 30 de marzo de 2022

Tribunal:
  1. Marta Evelia Aparicio García Presidenta
  2. Miguel Ángel Castellanos López Secretario
  3. Hugo Peyre Vocal
  4. José Manuel Reales Avilés Vocal
  5. Francisco José Abad García Vocal

Tipo: Tesis

Resumen

La investigación epidemiológica puede tener un gran impacto sobre los pacientes, especialmente en entornos clínicos. Los estudios observacionales basados en datos recogidos en los hospitales son herramientas muy valiosas, especialmente en situaciones en las que el tiempo es un elemento clave, ya que tienen la capacidad de estudiar una amplia gama de pacientes, y probar asociaciones muy complejas, tanto en lo que respecta a la búsqueda y estudio de patologías, su prevalencia, características, factores de riesgo o condiciones asociadas, como asociaciones entre tratamientos o intervenciones y resultados clínicos. En los últimos años la calidad de los estudios observacionales en epidemiología se ha visto sustancialmente incrementada. Se hipotetiza que este crecimiento se debe principalmente a dos motivos. Primero, a un adecuado diseño de investigación que tiene en cuenta todas las fuentes de error inherentes a la falta de aleatorización en los estudios observacionales. Segundo, debido a la proliferación y mejora de las historias clínicas electrónicas (EHR), los investigadores han podido acercar a la epidemiología varias técnicas utilizadas en otros campos del conocimiento. En la presente tesis pretendemos contribuir al estudio y la implementación de técnicas de aprendizaje automático que permitan aprovechar las EHR y bases de datos clínicas en los estudios epidemiológicos observacionales. Para ello, incorporamos técnicas de aprendizaje automático no supervisado del campo de la identificación de patrones para explorar patrones de comorbilidad en pacientes hospitalizados. En el estudio 1, comparamos el rendimiento de tres técnicas de reducción de la dimensionalidad (Análisis de Componentes Principales (PCA), t-Stochastic Neighbor Embedding (t-SNE) y Uniform Manifold Approximation and Projection (UMAP)) cuando se aplican con un análisis de conglomerados, encontrando un rendimiento superior de UMAP. Utilizamos este conocimiento en un segundo estudio, eligiendo UMAP para explorar el uso combinado de una técnica de reducción de la dimensionalidad y un análisis de conglomerados jerárquico aglomerativo en la recuperación de grupos de pacientes según sus comorbilidades, en una muestra de pacientes diagnosticados de depresión. Contrastando los resultados obtenidos con aquellos de la literatura, defendemos la valía de este método en el estudio de patrones de comorbilidades. Finalmente, en un tercer estudio utilizamos esta metodología para estudiar la asociación entre la mortalidad y diferentes patrones de comorbilidad en pacientes con trastornos psiquiátricos y COVID-19. Para ello, identificamos diferentes subgrupos de pacientes, en una muestra de pacientes con trastornos psiquiátricos hospitalizados por COVID-19 confirmada por laboratorio, mediante UMAP y un análisis de conglomerados jerárquico. Luego, comparamos la asociación entre cada grupo de pacientes y el criterio de valoración de la muerte en un modelo de regresión de Cox con ponderación de probabilidad inversa (IPW) para tener en cuenta posibles sesgos no medidos. El análisis de conglomerados detectó cinco grupos distintos de comorbilidades, y los análisis de supervivencia mostraron una asociación entre uno de estos grupos y la reducción de la mortalidad. En esta tesis se defiende la implementación de técnicas de aprendizaje automático no supervisado, como herramientas valiosas para los estudios observacionales epidemiológicos, especialmente para contextos clínicos en los que son frecuentes los trastornos altamente comórbidos, como la psiquiatría o la psicología de la salud.