Una metodología de minería de datos para la agrupación de series temporalesaplicación al sector de la construcción residencial

  1. Ferrán Aranaz, Magdalena
Dirigida por:
  1. Lorenzo Escot Mangas Director
  2. José Santiago Merino Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 07 de febrero de 2011

Tribunal:
  1. Miguel Martín Dávila Presidente
  2. Conrado Miguel Manuel García Secretario
  3. Julio Rodríguez López Vocal
  4. José María Montero Lorenzo Vocal
  5. Ricardo Gimeno Nogués Vocal
Departamento:
  1. Economía Aplicada, Pública y Política

Tipo: Tesis

Resumen

El análisis de series temporales es fundamental no sólo en la economía, sino en campos tan diversos como, por ejemplo, la ingeniería, la biología, la medicina, la psicología, la sociología e incluso las artes, siendo uno de los problemas más comunes el de comparar y relacionar un conjunto grande de series temporales. Las técnicas que facilitan la extracción de información de bases de datos voluminosas forman parte de la Minería de Datos. En este trabajo se presenta una metodología de minería de datos para la comparación de series temporales económicas que midan un mismo fenómeno o variable procedentes de diferentes ámbitos, localidades, agentes, condiciones, etc. Para desarrollar la metodología, realizaremos una aplicación al Mercado de la Vivienda, más específicamente al Sector de la Construcción Residencial, y compararemos la evolución de la oferta de vivienda nueva en las distintas provincias españolas. La metodología que se propone consiste, básicamente, en construir los K centroides iniciales del Algoritmo de las k-medias para un Análisis Cluster de Series Temporales. La solución obtenida permitirá interpretar las similitudes entre las distintas series temporales provinciales. Consideramos que la presente metodología, a la que denominaremos Metodología del haz de rectas, es muy útil como estudio exploratorio previo a la aplicación de cualquier modelo estadístico o económico que persiga objetivos tanto de tipo explicativo como de tipo predictivo. La tesis consta de siete capítulos. Los dos primeros describen los contextos en los que se aplica y se desarrolla la metodología. En el Capítulo 1 se describe la relevancia del Sector de la construcción residencial en la Economía y se justifican determinadas decisiones tales como la elección del tipo de interés como principal proceso generador de las oscilaciones de la serie de vivienda nueva. El Capítulo 2 está dedicado al marco teórico en el que se desarrolla la metodología: El Análisis Cluster de Series Temporales. El capítulo comienza con una introducción al Análisis Cluster general, para pasar a exponer más detalladamente el Algoritmo de las k-medias y los diversos Métodos de inicialización de este algoritmo. El núcleo de esta tesis corresponde al desarrollo de la metodología propiamente dicho y comprende los capítulos tercero y cuarto. En el Capítulo 3 se exponen los elementos teóricos sobre los que se sustenta la metodología. En el Capítulo 4 se ilustran las sucesivas etapas del proceso de agrupación de las series temporales mediante un caso práctico: se construye un conjunto de series resumen que se utilizarán como centroides iniciales del Algoritmo de las k-medias para la agrupación de las series de visados de vivienda nueva. La metodología propuesta en este trabajo se fundamenta en la existencia de una serie temporal como proceso generador de las oscilaciones del conjunto de series objeto de análisis aunque, para su aplicación, no sea necesario el conocimiento de dicha serie. En el Capítulo 5 supondremos que las fluctuaciones del tipo de interés son las principales responsables de las fluctuaciones de las series de visados, lo que nos permitirá repetir el proceso de construcción del conjunto de series resumen desarrollado en el Capítulo 4 pero, en este caso, bajo el supuesto de que el proceso generador de las oscilaciones del conjunto de series temporales objeto de análisis es conocido. En el Capítulo 6 se utilizan los resultados obtenidos en los capítulos 4 y 5 para interpretar la evolución del sector de la construcción residencial en términos de las diferencias y similitudes entre las distintas provincias. Finalmente, en el Capítulo 7 se exponen las conclusiones y se describen las futuras líneas de investigación.