Desarrollo de herramientas bioinformáticas para estudios de proteómica a gran escala de "Candida albicans"

  1. VIALAS FERNANDEZ, VITAL
Dirigida por:
  1. Concepcion Gil Garcia Directora

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 15 de enero de 2016

Tribunal:
  1. Jesús Pla Alonso Presidente
  2. Lucía Monteoliva Secretaria
  3. Alberto Pascual Montano Vocal
  4. Joaquin Abian Moñux Vocal
  5. Alberto Paradela Elizalde Vocal
Departamento:
  1. Microbiología y Parasitología

Tipo: Tesis

Resumen

Desarrollo de herramientas bioinformáticas para estudios de proteómica a gran escala de Candida albicans En la proteómica shotgun, el término inglés está muy establecido, el primer paso del experimento generalmente consiste en la digestión de las proteínas de la muestra en péptidos por acción de una enzima proteolítica como la tripsina. A continuación los péptidos son separados en cromatografía de forma que puedan ser ionizados e introducidos gradualmente en el espectrómetro de masas donde los péptidos son fragmentados y se adquieren espectros MS MS. Los espectros son entonces procesados computacionalmente. Los motores de búsqueda asignan secuencias peptídicas a cada espectro y se infieren las proteínas originarias presentes en las muestras. Y por último los resultados son evaluados estadísticamente mediante métodos como la Tasa de Falsos Descubrimientos, FDR o modelos estadísticos más complejos. La presencia de resultados de estudios de proteómica en repositorios públicos para el hongo patógeno oportunista Candida albicans eran hasta hace poco muy escasos, originados en instrumentos de baja resolución y por tanto, en ocasiones, no muy fiables. Así, el desarrollo de bases de datos y adopción de formatos estándar en proteómica juegan un papel esencial para analizar, comparar y presentar resultados. Las herramientas informáticas descritas en esta tesis contribuyen a esos objetivos. La base de datos y herramienta web Proteopathogen es la primera aplicación online descrita que combina resultados de experimentos de proteómica con información específica relevante para el estudio de proteínas de C. albicans como términos de la ontología génica Gene Ontology, GO, o las rutas de la Enciclopedia de Genes y Genomas de Kyoto, KEGG, en las que estan implicadas. Tras una primera versión en que los resultados de los experimentos se recogían en formatos de texto plano dependientes de la herramienta de software que hubiera generado los resultados, la aplicación y la base de datos han sido totalmente remodeladas para adaptarse al formato estándar de identificaciones mzIdentML como fuente de información. Proteopathogen, proteopathogen.dacya.ucm.es, es actualmente una herramienta online que facilita la visualización y análisis de los resultados de experimentos de Proteómica tanto por los usuarios del laboratorio como por parte de los revisores de las revistas donde los estudios son publicados. Además permite incorporar nuevos resultados de forma completamente independiente del procesamiento experimental y computacional que los ha generado. Paralelamente, el desarrollo de un PeptideAtlas para C. albicans ha supuesto la mayor caracterización de su proteoma disponible hasta la fecha describiendo más de 71000 péptidos detectados y asignados a 4174 proteínas, lo que supone dos terceras partes del proteoma predicho, e incluye información específica de los alelos originales. Es además el primer proteoma de un modelo de hongo patógeno en el proyecto global PeptideAtlas y cuenta con la robustez y fiabilidad en las identificaciones que proporciona el flujo de análisis Trans Proteomics Pipeline que incluye herramientas de conversión de archivos de espectros a formatos estándar, herramientas de identificación de péptidos, de inferencia de proteínas y de validacion estadística de los resultados.