Promotion, integration, management and processing of critical inpatients’ open big data repositories

  1. Armengol de la Hoz, Miguel Ángel
Dirigida por:
  1. Enrique Javier Gómez Aguilera Director/a
  2. Julio Ángel Mayol Martínez Codirector

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 20 de julio de 2020

Tribunal:
  1. María Elena Hernando Pérez Presidente/a
  2. Ernestina Menasalvas Secretario/a
  3. Matthieu Komorowski Vocal
  4. María José Martín Bautista Vocal
  5. Miguel Sánchez Garcia Vocal
  6. Rodrigo O. Deliberato Vocal
  7. María Luaces Méndez Vocal

Tipo: Tesis

Resumen

The results of the research work carried out in this doctoral thesis can be summarized in three main areas: 1. Social aspects: Promoting and boosting the use and integration of open clinical data repositories through datathons and scientific publications: in this sense we participated in several datathons in Asia, Europe, North America and South America. During the development of this thesis we were able to overcome different organizational, bureaucratic, cultural and professional barriers in the field of study of the promotion of Large Open Data Warehouses of critical patients enhancing the transference of knowledge between the clinical-technical world and the society. This work has led to the publication of two manuscripts so far. 2. Technological aspects: Define a basic layout that enhances the design of integrated, normalized and structured open and de-identified high-resolution clinical big data repositories. In addition, we were able to conduct a review on how the integration and management of large open critical patient data repositories can help drive critical patient research by working closely with critical care unit members to address their unmet needs and focus on delivering better value to their patients by means of cutting edge technologies such as big data and machine learning. This work has led to the publication of two manuscripts so far. 3. Clinical aspects: Using innovative statistical and machine learning techniques to mine data in order to answer relevant clinical questions about critical inpatients employing state-of-the-art knowledge. Finally, but most importantly, we address specific clinical issues in the two hospital departments where we focus our efforts: • Intensive Care Unit: we helped gather more knowledge about the obesity paradox, we study and improved the way severity scores are developed while providing open access to our exceptionally performing score for decision support, we studied how critical care outcomes differ throughout the United States geography, we developed a model for severe tachypnea risk in terminal patients, we address admission disorientation and risk of code status change, we studied how GCS mediates the baseline sodium effect when predicting mortality, finally we studied the association of chloride ion and sodium-chloride difference with acute kidney injury and mortality in critically ill patients. • Operating Room: we addressed the association of intraoperative hypotension with postoperative stroke, acute kidney injury and death in patients having cardiac surgery with cardiopulmonary bypass and in a more analytically advanced version of this project we trained Machine Learning models with preoperative risk factors and intraoperative hypotension parameters, so we were able to predict mortality following cardiac surgery. This work led to the publication of eight manuscripts so far, but most importantly allowed us and our collaborating physicians to broaden the knowledge about critically ill patients and their treatment optimization. It also helped us acquire essential data analysis skills that now and in the foreseeable future will aid us tackle a wide variety of clinically relevant questions. Los resultados de la labor de investigación realizada en esta tesis doctoral pueden resumirse en tres áreas principales: 1. Aspectos pedagógicos: Promoción e impulso del uso e integración de repositorios de datos clínicos abiertos a través de datathons y publicaciones científicas: en este sentido hemos participado en varios datathons en Asia, Europa, América del Norte y América del Sur. Durante el desarrollo de esta tesis pudimos superar diferentes barreras organizativas, burocráticas, culturales y profesionales en el campo de estudio de la promoción de Grandes Depósitos de Datos Abiertos de pacientes críticos. Este trabajo ha llevado a la publicación de dos manuscritos hasta ahora. 2. Aspectos tecnológicos: Definición y revisión de una estructura básica que mejore el diseño de grandes repositiorios de datos clínicos de alta resolución integrados, normalizados y estructurados, abiertos y anonimizados. Además, pudimos realizar un examen de la forma en que la integración y la gestión de grandes repositorios abiertos de datos de pacientes críticos puede ayudar a impulsar la investigación en ese ámbito trabajando en estrecha colaboración con los miembros de la unidad de cuidados intensivos para atender sus necesidades no cubiertas y así poder centrarnos en ofrecer un mejor valor a sus pacientes mediante tecnologías de vanguardia, como son el big data y Machine Learning. Este trabajo ha llevado a la publicación de dos manuscritos hasta ahora. 3. Aspectos clínicos: Utilización de innovadoras técnicas estadísticas y de machine learning para extraer datos con el fin de responder a las preguntas clínicas pertinentes sobre los pacientes hospitalizados críticos empleando los conocimientos más avanzados. Por último, pero más importante, abordamos cuestiones clínicas específicas en los dos departamentos del hospital en los que centramos nuestros esfuerzos: • Unidad de Cuidados Intensivos: ayudamos a entender mejor la paradoja de la obesidad, estudiamos y mejoramos la forma en la que se elaboran las scores de gravedad al tiempo que proporcionamos acceso abierto a nuestro algoritmo de rendimiento excepcional para el apoyo de decisiones, estudiamos cómo difieren los tratamientos de los cuidados intensivos en toda la geografía de los Estados Unidos, desarrollamos un modelo para el riesgo de taquipnea grave en pacientes terminales, abordamos la desorientación en los ingresos y el riesgo de cambio de estado del nivel de intervenciones médicas que un paciente desea que se inicien si su corazón o su respiración se detienen, estudiamos cómo la escala de coma de Glasgow media el efecto del sodio basal al predecir la mortalidad, por último estudiamos la asociación del ión cloruro y la diferencia de cloruro de sodio con la lesión renal aguda y la mortalidad en los pacientes críticos. • Quirófano: abordamos la asociación de la hipotensión intraoperatoria con el accidente cerebrovascular postoperatorio, la lesión renal aguda y la muerte en pacientes sometidos a cirugía cardíaca con baipás cardiopulmonar y en una versión más avanzada analíticamente de este proyecto entrenamos modelos de machine learning con factores de riesgo preoperatorios y parámetros de hipotensión intraoperatoria, para ser capaces de predecir la mortalidad después de la cirugía cardíaca. Este trabajo condujo a la publicación de ocho manuscritos hasta el momento, pero lo más importante fue que nos permitió a nosotros y a los médicos con los que colaborabamos ampliar el conocimiento sobre pacientes en estado crítico optimizar su tratamiento. También nos ayudó a adquirir habilidades esenciales de análisis de datos que ahora y en el futuro previsible nos ayudarán a abordar una amplia variedad de cuestiones clínicamente relevantes.