Aplicación de métodos de aprendizaje automático para el estudio de la comorbilidad inversa entre cáncer y trastornos del sistema nervioso central

  1. IBAÑEZ GARIKANO, KRISTINA
Dirigida por:
  1. Alfonso Valencia Herrera Director/a
  2. María Guijarro Mata-García Directora
  3. Gonzalo Pajares Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 27 de noviembre de 2015

Tribunal:
  1. Matilde Santos Peñas Presidenta
  2. Rubén Fuentes Fernández Secretario
  3. Vera Pancaldi Vocal
  4. Florencio Pazos Vocal
  5. Fátima Al-Shahrour Vocal
Departamento:
  1. Arquitectura de Computadores y Automática

Tipo: Tesis

Teseo: 121128 DIALNET

Resumen

La cantidad de datos biológicos y médicos que se produce hoy en día es enorme. Estos datos contienen información crucial que pueden ayudar a comprender mejor los mecanismos moleculares en los sistemas biológicos. La Bioinformática, junto con la Biología Computacional, son disciplinas que se encargan de organizar, analizar e interpretar los datos procedentes de la Biología Molecular. De hecho, la complejidad y la heterogeneidad de los problemas biológicos requieren de un continuo diseño, implementación y aplicación de nuevos métodos y algoritmos. La minería de datos biológicos es una tarea complicada debido a la naturaleza heterogénea y compleja de dichos datos. Esta tesis se basa en el estudio de un problema biomédico como es la comorbilidad inversa, padeciendo una enfermedad se reduce la probabilidad a contraer otra enfermedad distinta. El objetivo principal de esta tesis es explorar los mecanismos biológicos que hay detrás de la comorbilidad inversa entre cáncer y enfermedades neurológicas. Hemos desarrollado tres metodologías computacionales basadas en técnicas de aprendizaje automático y reconocimiento de patrones para abordar problemas especí¿cos relacionados con la comorbilidad inversa. En el primer método proponemos una nueva estrategia propia de minería de datos estadística a partir de datos de expresión génica entre ciertos tipos de cánceres y enfermedades neurológicas. El resultado principal a nivel molecular confirma la relación entre comorbilidad inversa y patrones opuestos de expresión génica, con¿rmando la existencia de un solapamiento relevante entre los genes sobre-expresados en los trastornos neurológicos y aquellos sub-expresados en cáncer, y a la inversa. En el segundo trabajo presentamos una metodología computacional nueva inspirada en el Enfriamiento Simulado (del inglés Simulated Annealing) para estudiar la comorbilidad inversa entre cáncer y enfermedades del SNC. En este caso utilizamos aproximaciones relacionadas con la teoría de redes, puesto que los sistemas moleculares están organizados como redes de interacción. Utilizando las redes de interacción de proteínas junto con datos de expresión de genes, observamos que las enfermedades del SNC están caracterizadas por una estructura de red que se puede interpretar de mayor estabilidad que sus correspondientes controles, mientras que las redes anotadas con la expresión de genes de cáncer tienden a ser menos estables que sus correspondientes controles. Además, esta inestabilidad en la red parece que aumenta con la progresión del cáncer. El tercer trabajo se basa en la combinación de técnicas de clasi¿cación no supervisadas (SOM y K-Means). Examinamos de manera crítica si las proteínas relacionadas con cáncer (CRPs) tienden a estar más o menos conectadas. Asimismo, analizamos también si las proteínas relacionadas con trastornos neurológicos (NRPs) tienen un comportamiento opuesto al que muestran las CRPs, siguiendo así la teoría de la comorbilidad inversa. Observamos que los grupos (clusters) más relevantes enriquecidos en CRPs incluyen proteínas altamente conectadas, mientras que grupos enriquecidos en NRPs incluyen proteínas menos conectadas entre sí. Esta tesis constituye un trabajo de investigación nueva, original y multidisciplinar en el que se estudia la base molecular de la comorbilidad inversa, incluyendo tres metodologías que abordan y proponen soluciones a tres problemas especí¿cos en el área. El diseño, desarrollo y aplicación de estas metodologías tienen su eje en los campos de la minería de datos y aprendizaje automático, y los resultados obtenidos son signi¿cativos en los campos de la comorbilidad inversa y la biomedicina.