Ejecución eficiente de flujos de trabajos computacionales en entornos de Grid

  1. Vázquez Poletti, José Luis
Dirigida por:
  1. Rubén Manuel Santiago Montero Director
  2. Ignacio Martín Llorente Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 07 de octubre de 2008

Tribunal:
  1. Domenico Laforenza Vocal
Departamento:
  1. Arquitectura de Computadores y Automática

Tipo: Tesis

Resumen

Entre los diferentes aspectos que rodean a la Computacion Grid, esta Tesis Doctoral se centra en la ejecución eficiente de flujos de trabajos. Los flujos de trabajos reflejan las necesidades de complejidad del ser humano, y la Computación Grid comienza a ser madura para resolver problemas cientificos, puesto que permite el acceso a una gran cantidad de recursos. No obstante, debido a su naturaleza inherente el Grid no está completamente listo para ejecutar bastantes tipos de flujos de trabajos en un tiempo razonable. Con el objetivo de justificar la adopción de este paradigma de la computación, se deben analizar los algoritmos que rigen estos flujos de trabajos y de ahí, implantar optimizaciones para que su ejecución gane eficiencia. Este trabajo comienza con una introducción a la Computación Grid donde se explican sus principales componentes y se describen las infraestructuras más significativas. Como los flujos de trabajos son implantados por aplicaciones, este Capítulo servirá también de introducción al portado, por lo que se hablaré de diferentes tecnologías a diferentes niveles. El tipo más sencillo de flujo de trabajos, las aplicaciones de alta productividad, son las primeras en ser estudiadas. Así, una aplicación de Física de Fusión suministrada por el CIEMAT4 necesitaba incrementar la cantidad de datos procesados. La Computación Grid garantizó al principio la eficiencia necesaria. Cuando esta cantidad aumentó nuevamente, se adoptó una estrategia del tipo chunk con buenos resultados. La complejidad se incrementó en el Capítulo siguiente, donde una aplicación bioinformática propuesta por el CNIO5 encuentra en el Grid la mejor solución para evitar las restricciones de memoria de una única máquina. Como la ejecución en el Grid no estaba ahorrando suficiente tiempo, se estudiaron diferentes heurísticas de optimización. De éstas, se eligieron dos para su implantación y estudio posterior. Adicionalmente, este trabajo presenta un modelo válido para predecir el tiempo de ejecución según las condiciones de partida, también usando las heurísticas implantadas.