Desarrollo de una plataforma eficiente de análisis de datos en bioinformática y biología computacional

  1. Nogales Cadenas, Rubén
Dirigida por:
  1. Alberto Pascual Montano Director/a
  2. Francisco Tirado Fernández Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 23 de noviembre de 2010

Tribunal:
  1. Daniel Mozos Muñoz Presidente
  2. Manuel Prieto Matías Secretario
  3. Victoriano Segura Ruiz Vocal
  4. Oswaldo Trelles Vocal
  5. Ana Conesa Cegarra Vocal
Departamento:
  1. Arquitectura de Computadores y Automática

Tipo: Tesis

Teseo: 312696 DIALNET

Resumen

La difusión de técnicas experimentales a gran escala en el área biomédica ha permitido el estudio de la Biología Molecular desde una perspectiva global, pero también ha generado una enorme cantidad de información que es necesario procesar y analizar para extraer conocimiento biológico, ya sea con el fin de plantear nuevas hipótesis de trabajo o para confirmar las hipótesis previamente consideradas. En esta tesis doctoral se ha desarrollado una plataforma de análisis funcional orientada al análisis de datos de expresión génica y a su integración con información biológica externa de diversa naturaleza. En concreto, se partió del desarrollo de una novedosa metodología de extracción de patrones frecuentes a partir de grandes conjuntos de datos que sirvió para la creación de una aplicación basada en enriquecimiento modular de anotaciones biológicas para caracterizar listas de genes y la elaboración de una metodología de extracción de reglas asociativas a partir de datos de expresión génica. Sin embargo, los métodos de análisis funcional actuales se encuentran limitados por la gran redundancia inherente a la información biológica y por el sesgo en la distribución de esta información. En esta tesis se estudia este problema y se propone un novedoso y robusto método de recuperación de módulos de genes y tópicos biológicos que soluciona el problema de la redundancia en datos, explicando de manera veraz y resumida la biología asociada a un conjunto de genes. Adicionalmente, el afán puesto en el estudio e integración de datos desembocó en la recopilación de un conjunto genes y proteínas considerados centrosomales en base a una serie de evidencias y a la consecuente creación de una base de datos orientada al estudio de dicho complejo celular desde diversos puntos de vista, incluida una perspectiva evolutiva. La plataforma de análisis funcional y datos se enmarca dentro de una infraestructura eficiente que conecta los diversos módulos funcionales a través de la tecnología de Web Services SOAP, proporcionando adicionalmente un interfaz programático, y haciendo uso de un cluster computacional y un entorno multigrid, que ha permitido mejorar la productividad del sistema y completar el trabajo con el desarrollo y agregación de diferentes metodologías y aplicaciones, repositorios de datos e incluso un framework de desarrollo de aplicaciones bioinformáticas. Esperamos que el resultado de esta tesis doctoral sea de utilidad para los investigadores del área de genómica y...