Aplicación de métodos big data al análisis de datos biomédicosidentificación de factores asociados con la presencia de datos incompletos y estudio de secuencias de eventos

  1. Piñero de Armas, Juan José
Zuzendaria:
  1. Antonio David Prieto Merino Zuzendaria

Defentsa unibertsitatea: Universidad Católica San Antonio de Murcia

Fecha de defensa: 2021(e)ko urria-(a)k 26

Epaimahaia:
  1. María del Carmen Carazo Díaz Presidentea
  2. Inmaculada Herranz Tejedor Idazkaria
  3. Antonio Sarría Santamera Kidea

Mota: Tesia

Teseo: 705474 DIALNET

Laburpena

La presencia de datos faltantes en las bases de datos biomédicas, puede sesgar los análisis y reducir su precisión. Los métodos de imputación de estos habitualmente denominados "missing data" corrigen parcialmente el problema pero necesitan modelos adecuados que relacionen su ocurrencia con el valor de las demás variables. Hemos utilizado regresiones logísticas con efectos aleatorios para identificar qué factores del paciente o centro médico están asociados con una mayor presencia de missing data en otras variables en bases de datos de gran tamaño. Para poder lidiar con una cantidad tan grande de datos hemos aplicado tres enfoques diferentes: 1) análisis con el conjunto completo de los datos, 2) análisis independientes intra-centro y el posterior metaanálisis de sus coeficientes, 3) análisis independientes en particiones aleatorias de los datos y su posterior metaanálisis.