Paralelización de algoritmos de comparación de secuencias biológicas en grandes bases de datos

  1. TRELLES SALAZAR, OSWALDO
unter der Leitung von:
  1. José María Carazo García Doktorvater/Doktormutter

Universität der Verteidigung: Universidad de Málaga

Jahr der Verteidigung: 1996

Gericht:
  1. José Mira Mira Präsident/in
  2. Oscar Plata González Sekretär/in
  3. Francisco Tirado Fernández Vocal
  4. Francisca Maria Sánchez Jimenez Vocal
  5. Alfonso Valencia Herrera Vocal

Art: Dissertation

Teseo: 53845 DIALNET

Zusammenfassung

Este trabajo se centra en la comparacion de secuencias biologicas de dna o de proteina, y en los aportes que desde la computacion de alto rendimiento hacemos para resolver problemas en las siguientes areas: matrices de puntos (dotplots): reformulacion de su analisis desde la perspectiva del procesamiento digital de imagenes, abriendo un conjunto nuevo de posibilidades en el area.Busquedas en bases de datos: desarrollo de una estrategia generica para la paralelizacion de los algoritmos de busqueda, con especial interes en los problemas de distribucion y balanceo del gran volumen de datos de las secuencias biologicas. La estrategia se ha mostrado portable a lo largo de diversas arquitecturas que van desde los cluster de estaciones de trabajo hasta los grandes supercomputadores. Significancia estadistica: desarrollo de una propuesta eficiente para reproducir las distribuciones de semejanzas desde las cuales se evalua la significancia. El algoritmo se ajusta perfectamente a las estrategias de paralelizacion desarrolladas. Alineamientos multiples: propuesta para reducir el enorme espacio computacional de este tipo de trabajos, con resultados plenamente satisfactorios y una implementacion en paralelo.