Arquitectura híbrida para el estándar de compresión de vídeo H.265/HEVC

Fernández Herrera, David Guillermo

Arquitectura híbrida para el estándar de compresión de vídeo H.265/HEVC

Fernández Herrera, David Guillermo

Dirigida por:

Alberto A. del Barrio García Director
Guillermo Botella Juan Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 14 de noviembre de 2019

Tribunal:

Katzalin Olcoz Presidenta
Rafael Rodriguez Sanchez Secretario
Otoniel Mario López Granado Vocal
Antonio García Ríos Vocal
Jose Luis Martinez Martinez Vocal

Departamento:

Arquitectura de Computadores y Automática

Tipo: Tesis

Teseo: 151628 DIALNET Docta Complutense editor

Resumen

En las últimas décadas las aplicaciones multimedia han evolucionado enormemente. Los estándares de compresión de vídeo han contribuido notablemente a este avance convirtiéndose en esenciales para la transmisión de datos multimedia. Debido a la creciente demanda de contenido digital, hoy en día resulta de vital importancia optimizar el ancho de banda utilizado para la transmisión de vídeo digital, buscando obtener grandes tasas de compresión de datos sin pérdidas apreciables en la calidad del servicio. Desde finales de la década de los ochenta, se han desarrollado varios estándares de codificación de vídeo para aplicaciones de transmisión en tiempo real. High Efficiency Video Coding (HEVC), también conocido como H.265, supone un gran salto tecnológico en la compresión de vídeo, proporcionando mejor eficiencia en la compresión respecto a estándares predecesores. El principal objetivo que persigue HEVC respecto a su antecesor H.264, consiste en reducir la tasa de datos generada en un 50% para un nivel de calidad preestablecido. Sin embargo, esta mejora en las prestaciones ha sido obtenida a expensas de incrementar considerablemente la complejidad del algoritmo. En el trabajo realizado, se proponen una serie de optimizaciones sobre el flujo de codificación HEVC basadas en la detección de regiones espacial y temporalmente homogéneas. Sobre las zonas clasificadas en alguna de estas categorías, se aplican una serie de algoritmos de optimización que permiten acelerar la codificación a expensas de un incremento inapreciable en la tasa de datos generada y proporcionando un alto nivel de calidad visual. Los procesos de evaluación de las prestaciones de todas las optimizaciones propuestas y los asociados a la determinación de los umbrales utilizados, han sido llevados a cabo empleando métricas con consideraciones perceptuales basadas en el funcionamiento del sistema visual humano. Adicionalmente, en el trabajo realizado se presentan diversas mejoras de la calidad visual subjetiva. Tras verificar la eficiencia de las optimizaciones realizadas en el software de referencia del estándar HEVC, se implementó el flujo completo dentro de un codificador HEVC capaz de soportar ejecución en tiempo real. El cómputo heterogéneo permite explorar nuevos caminos para abordar problemas computacionalmente muy intensivos utilizando plataformas de bajo consumo y bajo coste. Por ello, se decidió utilizar una plataforma basada en FPGA-GPU-microprocesador para verificar el funcionamiento de las propuestas realizadas bajo condiciones de ejecución en tiempo real. La FPGA es utilizada para extraer tanto el vídeo como el audio de una entrada SDI (Serial Digital Interface). Tras realizar la extracción, los datos válidos son transferidos a la GPU por medio de un bus PCIe. La GPU es utilizada para llevar a cabo una etapa de pre-procesado de la imagen y para realizar el análisis y posterior clasificación de las regiones espacial y temporalmente homogéneas existentes en la señal de vídeo de entrada. La información extraída por la GPU relativa a las características presentes en las imágenes de entrada, es compartida con el microprocesador. Finalmente, conforme a esta información, el flujo de codificación HEVC optimizado es ejecutado en el microprocesador.