Problemas de tratamiento de imágenes basados en la incorporación de características humanas

  1. Flores Vidal, Pablo Arcadio
unter der Leitung von:
  1. Daniel Gómez González Doktorvater

Universität der Verteidigung: Universidad Complutense de Madrid

Fecha de defensa: 08 von November von 2019

Gericht:
  1. Francisco Javier Yáñez Gestoso Präsident
  2. Rosario Espínola Vílchez Sekretärin
  3. Ana Elizabeth García Sipols Vocal
  4. Pedro Melo Pinto Vocal
  5. Carlos López Molina Vocal
Fachbereiche:
  1. Estadística y Ciencia de los Datos

Art: Dissertation

Zusammenfassung

Esta memoria se enmarca en el tratamiento de imágenes digitales, disciplina que cuenta cada vez con más aplicaciones. Los algoritmos desarrollados para trabajar con imágenes digitales pueden realizar tareas que oscilan desde un bajo nivel de procesamiento -donde se sitúa la detección de bordes- a un nivel de procesamiento alto, como es el reconocimiento de objetos. Al estar en la base del tratamiento de imágenes -junto con técnicas como el suavizado-, la detección de bordes juega un papel fundamental como paso inicial de muchas de estas técnicas y aplicaciones. Esto se debe a que, por ejemplo, reconocer un objeto en una imagen requiere en general el hallar previamente las diferencias importantes en la información espectral entre los píxeles. Para encontrar estas diferencias hace falta pasar por una serie de fases, la última de las cuales es el escalado. En esta fase final, se decide si tales diferencias significan que dicho píxel tiene que ser declarado un borde o no. El enfoque clásico durante esta fase de escalado consiste en tomar la decisión de si hay un borde o no estudiando píxel a píxel. Esto puede considerarse como un método de evaluación local, el cual presenta problemas prácticos, ya que los píxeles candidatos a borde no deben considerarse independientes. Se marcó como objetivo principal la conceptualización y profundización del problema definido anteriormente y otros problemas similares de tratamiento de imágenes, lo cual permitiría un nuevo enfoque que posibilitase el desarrollo de nuevos algoritmos de detección de bordes que se asemejasen a la visión humana. De este modo, se esperaban alcanzar mejoras en las comparativas frente a los humanos. Paralelamente a este objetivo, se persiguió la creación de un conjunto de imágenes de referencia más adecuado para la evaluación global, ya que los usados en la literatura se basan en la metodología de evaluación local. Se propone en esta memoria una estrategia alternativa basada en evaluación global, donde para tomar la decisión de si un píxel es borde o no, se construyen cadenas de píxeles conectados en estructuras que forman caminos de píxeles contiguos que se han llamado segmentos. Una vez construidos éstos, y siguiendo el procedimiento establecido por Venkatesh y Rosin en 1996, se presentan dos novedosos algoritmos -uno no supervisado y el otro de machine learning- de detección de bordes basados en segmentos, de los cuales se pueden extraer características visuales similares a las utilizadas por la visión humana, lo que a priori puede conducir a mejores resultados en las comparativas frente a humanos. Además, se propone una tercera vía de trabajo con segmentos, donde el algoritmo funciona como técnica de posprocesamiento, tomando como input una salida cualquiera proveniente de otro algoritmo de detección de bordes. Se exploran también nuevas aproximaciones para utilizar el color -imágenes RGB- en la detección de bordes. Además, se propone un novedoso algoritmo de detección de bordes basado en la creación de un nuevo espacio de color de 8 dimensiones, el cual permite hallar diferencias más sutiles que las del RGB. Se presenta además una nueva aproximación para el reconocimiento de árboles a partir de imágenes tomadas con sensores LIDAR. Los algoritmos propuestos muestran que el uso de segmentos presenta mejoras en las comparativas respecto a otros algoritmos de detección de bordes estándar (Canny o Sobel). Analizando los resultados, se concluye que, aunque el problema de clasificar los segmentos en ¿verdaderos¿ y ¿falsos¿ no es un problema trivial, se aprecian mejoras cuando se emplea la evaluación global frente a la local. Otra de las contribuciones de esta memoria está relacionada con el trabajo en varios canales (RGB), clarificándose y estudiando diferentes metodologías de agregación de los mismos de un modo novedoso; habiéndose desarrollado un nuevo espacio de color que extiende el RGB a 8 dimensiones, el cual se demuestra superior al RGB en las comparativas.