Paralelización de algoritmos de comparación de secuencias biológicas en grandes bases de datos

  1. TRELLES SALAZAR, OSWALDO
Dirigida per:
  1. José María Carazo García Director/a

Universitat de defensa: Universidad de Málaga

Any de defensa: 1996

Tribunal:
  1. José Mira Mira President/a
  2. Oscar Plata González Secretari/ària
  3. Francisco Tirado Fernández Vocal
  4. Francisca Maria Sánchez Jimenez Vocal
  5. Alfonso Valencia Herrera Vocal

Tipus: Tesi

Teseo: 53845 DIALNET

Resum

Este trabajo se centra en la comparacion de secuencias biologicas de dna o de proteina, y en los aportes que desde la computacion de alto rendimiento hacemos para resolver problemas en las siguientes areas: matrices de puntos (dotplots): reformulacion de su analisis desde la perspectiva del procesamiento digital de imagenes, abriendo un conjunto nuevo de posibilidades en el area.Busquedas en bases de datos: desarrollo de una estrategia generica para la paralelizacion de los algoritmos de busqueda, con especial interes en los problemas de distribucion y balanceo del gran volumen de datos de las secuencias biologicas. La estrategia se ha mostrado portable a lo largo de diversas arquitecturas que van desde los cluster de estaciones de trabajo hasta los grandes supercomputadores. Significancia estadistica: desarrollo de una propuesta eficiente para reproducir las distribuciones de semejanzas desde las cuales se evalua la significancia. El algoritmo se ajusta perfectamente a las estrategias de paralelizacion desarrolladas. Alineamientos multiples: propuesta para reducir el enorme espacio computacional de este tipo de trabajos, con resultados plenamente satisfactorios y una implementacion en paralelo.