Re-identificación de personas mediante la distancia de Mahalanobis

  1. María J. Gómez-Silva 1
  2. José M. Armingol 1
  3. Arturo de la Escalera 1
  1. 1 Universidad Carlos III de Madrid
    info

    Universidad Carlos III de Madrid

    Madrid, España

    ROR https://ror.org/03ths8210

Libro:
XXXIX Jornadas de Automática: actas. Badajoz, 5-7 de septiembre de 2018
  1. Inés Tejado Balsera (coord.)
  2. Emiliano Pérez Hernández (coord.)
  3. Antonio José Calderón Godoy (coord.)
  4. Isaías González Pérez (coord.)
  5. Pilar Merchán García (coord.)
  6. Jesús Lozano Rogado (coord.)
  7. Santiago Salamanca Miño (coord.)
  8. Blas M. Vinagre Jara (coord.)

Editorial: Universidad de Extremadura

ISBN: 978-84-9749-756-5 978-84-09-04460-3

Año de publicación: 2018

Páginas: 967-974

Congreso: Jornadas de Automática (39. 2018. Badajoz)

Tipo: Aportación congreso

DOI: 10.17979/SPUDC.9788497497565.0967 DIALNET GOOGLE SCHOLAR lock_openRUC editor

Resumen

La re-identificación de una persona requiere del aprendizaje de una distancia métrica capaz de comparar dos imágenes y decidir si pertenecen o no a la misma persona. La automatización de esta tarea, para su aplicación en videovigilancia inteligente, plantea un gran reto debido a la presencia de personas con una apariencia similar. Por ello, es necesario el aprendizaje de características discriminativas, y de una métrica que las combine apropiadamente. Sin embargo, las variaciones de iluminación, perspectiva, fondo, resolución o escala entre dos imágenes de una misma persona, capturada desde vistas diferentes, hacen que su apariencia varíe, dificultando su re-identificación. Este artículo propone la codificación de las trasformaciones entre las vistas, en una matriz de Mahalanobis, cuya estimación ha sido integrada en el aprendizaje de las características discriminativas, de modo que estas últimas puedan reflejar las disimilitudes principalmente debidas a cambios de apariencia y no de punto de vista. Esta estimación ha sido implementada como una nueva capa de una red neuronal convolucional profunda, que ha sido entrenada y evaluada con la base de datos PRID2011