Proteogenómica y splicing alternativo

  1. Ezkurdia Garmendia, Lakes
Dirigida por:
  1. Michael Tress Director/a

Universidad de defensa: Universidad Autónoma de Madrid

Fecha de defensa: 08 de febrero de 2016

Tribunal:
  1. Concepcion Gil Garcia Presidenta
  2. Fernando Jose Corrales Izquierdo Secretario/a
  3. Gonzalo Gómez López Vocal
  4. Ana María Rojas Mendoza Vocal
  5. María del Mar Alba Soler Vocal

Tipo: Tesis

Resumen

La anotación manual de los genes codificantes de proteína requiere diversas fuentes de evidencia. Conseguir evidencia experimental de la expresión de las proteínas sigue siendo un reto técnico complicado. La mayoría de métodos se basan en predicciones computacionales y evidencia experimental a nivel de transcrito. La tecnología de espectrometría de masas ha avanzado considerablemente en las dos últimas décadas, situándola como una herramienta puntera para proyectos de anotación genómica. La espectrometría de masas permite la depuración y validación de genes codificantes y transcritos alternativos, así como la detección de nuevas regiones codificantes. La proteogenómica, una disciplina entre la genómica y la proteómica, requiere el desarrollo de métodos y estrategias computacionales para el análisis de datos a gran escala. El objetivo principal de esta tesis es desarrollar métodos computacionales para el proceso y análisis de datos proteómicos y genómicos. Para ello se han diseñado varias estrategias de análisis de datos proteómicos a gran escala. En la primera parte se aplican los flujos de trabajo diseñado para la búsqueda, validación y curación de resultados proteómicos, a partir de diversas fuentes de datos genómicos. La caracterización de isoformas alternativas y eventos de splicing en humano y ratón muestra tres grupos sobrerrepresentados. En concreto, las ribonucleoproteínas nucleares, las isoformas alternativas generadas a partir de exones homólogos, y las creadas a partir de deleciones pequeñas. El estudio se amplía utilizando una base de datos experimentales proteómicos mayor, y con ello se corrobora que la mayoría de genes expresa una proteína dominante. Se demuestra que los eventos de splicing detectados a nivel de proteína conservan los dominios funcionales. Finalmente, se ratifica que más del 20% de las isoformas de splicing están generadas por exones homólogos, que estas son específicas de tejido, y que están notablemente conservadas, advirtiéndose su posible relevancia a nivel celular. En la última parte se utilizan los péptidos de ocho experimentos proteómicos a gran escala para caracterizar la isoforma más expresada del gen. La comparativa de la isoforma proteómica más expresada coincide con la de dos métodos ortólogos analizados. Uno basado en la conservación de función y estructura, y el otro basado en anotaciones genómicas corregidas por expertos. Los resultados muestran la tendencia hacia la expresión de una sola isoforma, independientemente del tejido, y confirman la idoneidad de APPRIS para la predicción de isoformas principales.