Estrategias para la explotación de paralelismo a nivel de palabra y SMT

  1. GARCÍA SÁNCHEZ, CARLOS
Supervised by:
  1. Manuel Prieto Matías Director
  2. Francisco Tirado Fernández Co-director

Defence university: Universidad Complutense de Madrid

Fecha de defensa: 01 March 2007

Committee:
  1. Román Hermida Correa Chair
  2. Luis Piñuel Moreno Secretary
  3. José María Carazo García Committee member
  4. Francisco Fernández Rivera Committee member
  5. Ana María Ripoll Aracil Committee member
Department:
  1. Arquitectura de Computadores y Automática

Type: Thesis

Teseo: 135924 DIALNET

Abstract

Esta tesis aborda el problema de optimización y paralelización de diversas aplicaciones en un nuevo escenario arquitectónico que ha surgido con la incorporación de nuevos niveles de paralelismo dentro de los procesadores de propósito general actuales. Se ha revisado una serie de algoritmos de gran importancia en el ámbito de la ciencia en los que el grupo de investigación al que pertenezco ha estado trabajando en los últimos años. Las propuestas anteriormente estudiadas no son del todo válidas en el nuevo escenario arquitectónico actual, por lo que su revisión es de gran utilidad. Se han empleado aplicaciones de campos bien diversos con el fin de obtener unas conclusiones relevantes y darle una generalidad al trabajo incrementado de esta manera su interés practico. Las aplicaciones en las que se han trabajado va desde los métodos multiescala empleados en la resolución de ecuaciones diferencias, la transformada Wavelet incorporada en el estándar de comprensión de imágenes JPEG2000 y los mapas auto-organizativos usados para clasificar imágenes tomográficas. La pralelización propuesta en la literatura de este tipo de algoritmos ha sido estudiada en otro contexto arquitectónico, donde era prioritario la explotación eficiente de la localidad datos. Estas estrategias estaban basadas en al división del conjunto de datos de entrada que procesaban los diferentes procesadores. Este esquema de paralelización presenta muchos inconvenientes en arquitectura SMT tal y como se h demostrado en este trabajo. Nuestra propuesta alternativa propone una división de tareas que proporciona mejores resultados desde el punto de vista del rendimiento. También hemos estudiado la mejora producida en la explotación del paralelismo a nivel de datos, incorporando nuevos esquemas de vectorización al conjunto de las aplicaciones bajo estudio. Las mejoras experimentadas han sido bastante significativas en todos los casos. Y finalmente se ha profundizado