Paralelización de algoritmos de comparación de secuencias biológicas en grandes bases de datos
- TRELLES SALAZAR, OSWALDO
- José María Carazo García Director/a
Universitat de defensa: Universidad de Málaga
Any de defensa: 1996
- José Mira Mira President/a
- Oscar Plata González Secretari/ària
- Francisco Tirado Fernández Vocal
- Francisca Maria Sánchez Jimenez Vocal
- Alfonso Valencia Herrera Vocal
Tipus: Tesi
Resum
Este trabajo se centra en la comparacion de secuencias biologicas de dna o de proteina, y en los aportes que desde la computacion de alto rendimiento hacemos para resolver problemas en las siguientes areas: matrices de puntos (dotplots): reformulacion de su analisis desde la perspectiva del procesamiento digital de imagenes, abriendo un conjunto nuevo de posibilidades en el area.Busquedas en bases de datos: desarrollo de una estrategia generica para la paralelizacion de los algoritmos de busqueda, con especial interes en los problemas de distribucion y balanceo del gran volumen de datos de las secuencias biologicas. La estrategia se ha mostrado portable a lo largo de diversas arquitecturas que van desde los cluster de estaciones de trabajo hasta los grandes supercomputadores. Significancia estadistica: desarrollo de una propuesta eficiente para reproducir las distribuciones de semejanzas desde las cuales se evalua la significancia. El algoritmo se ajusta perfectamente a las estrategias de paralelizacion desarrolladas. Alineamientos multiples: propuesta para reducir el enorme espacio computacional de este tipo de trabajos, con resultados plenamente satisfactorios y una implementacion en paralelo.