Paralelización de algoritmos de comparación de secuencias biológicas en grandes bases de datos

  1. TRELLES SALAZAR, OSWALDO
Supervised by:
  1. José María Carazo García Director

Defence university: Universidad de Málaga

Year of defence: 1996

Committee:
  1. José Mira Mira Chair
  2. Oscar Plata González Secretary
  3. Francisco Tirado Fernández Committee member
  4. Francisca Maria Sánchez Jimenez Committee member
  5. Alfonso Valencia Herrera Committee member

Type: Thesis

Teseo: 53845 DIALNET

Abstract

Este trabajo se centra en la comparacion de secuencias biologicas de dna o de proteina, y en los aportes que desde la computacion de alto rendimiento hacemos para resolver problemas en las siguientes areas: matrices de puntos (dotplots): reformulacion de su analisis desde la perspectiva del procesamiento digital de imagenes, abriendo un conjunto nuevo de posibilidades en el area.Busquedas en bases de datos: desarrollo de una estrategia generica para la paralelizacion de los algoritmos de busqueda, con especial interes en los problemas de distribucion y balanceo del gran volumen de datos de las secuencias biologicas. La estrategia se ha mostrado portable a lo largo de diversas arquitecturas que van desde los cluster de estaciones de trabajo hasta los grandes supercomputadores. Significancia estadistica: desarrollo de una propuesta eficiente para reproducir las distribuciones de semejanzas desde las cuales se evalua la significancia. El algoritmo se ajusta perfectamente a las estrategias de paralelizacion desarrolladas. Alineamientos multiples: propuesta para reducir el enorme espacio computacional de este tipo de trabajos, con resultados plenamente satisfactorios y una implementacion en paralelo.