Paralelización de algoritmos de comparación de secuencias biológicas en grandes bases de datos
- TRELLES SALAZAR, OSWALDO
- José María Carazo García Zuzendaria
Defentsa unibertsitatea: Universidad de Málaga
Defentsa urtea: 1996
- José Mira Mira Presidentea
- Oscar Plata González Idazkaria
- Francisco Tirado Fernández Kidea
- Francisca Maria Sánchez Jimenez Kidea
- Alfonso Valencia Herrera Kidea
Mota: Tesia
Laburpena
Este trabajo se centra en la comparacion de secuencias biologicas de dna o de proteina, y en los aportes que desde la computacion de alto rendimiento hacemos para resolver problemas en las siguientes areas: matrices de puntos (dotplots): reformulacion de su analisis desde la perspectiva del procesamiento digital de imagenes, abriendo un conjunto nuevo de posibilidades en el area.Busquedas en bases de datos: desarrollo de una estrategia generica para la paralelizacion de los algoritmos de busqueda, con especial interes en los problemas de distribucion y balanceo del gran volumen de datos de las secuencias biologicas. La estrategia se ha mostrado portable a lo largo de diversas arquitecturas que van desde los cluster de estaciones de trabajo hasta los grandes supercomputadores. Significancia estadistica: desarrollo de una propuesta eficiente para reproducir las distribuciones de semejanzas desde las cuales se evalua la significancia. El algoritmo se ajusta perfectamente a las estrategias de paralelizacion desarrolladas. Alineamientos multiples: propuesta para reducir el enorme espacio computacional de este tipo de trabajos, con resultados plenamente satisfactorios y una implementacion en paralelo.