Data science applied to refining socio-economic indicators for decision-making
- Salcedo Galiano, Antonio Maurilio
- Gregorio Izquierdo Llanes Director/a
- Lorenzo Escot Mangas Director
Universidad de defensa: Universidad Complutense de Madrid
Fecha de defensa: 11 de septiembre de 2019
- Federico Cabrillo Rodríguez Presidente/a
- Conrado Miguel Manuel García Secretario
- Rafael Castejón Montijano Vocal
- Cristóbal Torres Albero Vocal
- Elena Mañas Alcón Vocal
Tipo: Tesis
Resumen
La construcción de sistemas de indicadores socio-económicos que representen los distintos fenómenos de la forma más precisa posible constituye un continuo reto en la producción de estadísticas. Poniendo la atención en uno de los aspectos de mayor grado de complejidad - el paradigma de medición de la pobreza monetaria en el marco de la Agenda 2030 - en esta investigación doctoral se analizan sus principales elementos y enfoques metodológicos para tratar de dar respuesta a tres situaciones concretas por medio de la aplicación de la ciencia de datos: - Equivalencia o equivalización (equivalization): Mediante esta técnica se busca transformar una variable económica de hogares a individuos, otorgando un diferente peso a los miembros de cada hogar. La OCDE ha desarrollado varias escalas de equivalencia si bien ha señalado que la elección de una u otra escala tendría un efecto directo en los resultados de los indicadores. - Umbrales: La tasa de riesgo de pobreza monetaria puede considerarse como un indicador socio-económico basado en un concepto de distancia económica, entendido como un porcentaje p de la mediana del ingreso equivalente por adulto. En la Unión Europea se calcula situando el porcentaje p en el 60% en todos los países, si bien Naciones Unidas y la OCDE recomiendan situar ese valor en el 50% de la mediana. El hecho de que estas prestigiosas instituciones recomienden por convención distintos porcentajes supone una oportunidad para buscar mejoras en el cálculo del valor de p. - Perspectiva multidimensional: El enfoque clásico basado en el uso de un indicador unidimensional, obtenido exclusivamente de la renta disponible, ofrece ciertas limitaciones al tratar de representar un fenómeno muy complejo mediante una única variable. En este sentido se ha planteado si una visión multidimensional derivada de la terna ingreso - consumo - riqueza podría proporcionar una mejor solución dado que integraría más variables claramente relacionadas con ese fenómeno. Como principales resultados en este trabajo se consigue aplicar un modelo de escala de equivalencia paramétrico no lineal que generaliza los modelos actualmente propuestos por la OCDE, permitiendo adicionalmente la inclusión de paridades de poder de compra lo que, en su conjunto, ofrece un mejor ajuste por regiones. Adicionalmente la aplicación de las curvas ROC en la fase de determinación de los puntos de corte óptimo permite disponer de resultados que suponen una mejora de la coherencia temporal frente a los indicadores de carencia material severa. Finalmente el empleo de un modelo multidimensional basado en el ingreso-consumo de los hogares, estimado a nivel de microdato, permite una ampliación del modelo clásico y, de forma combinada, también ofrece un refinado de los resultados particularmente en lo que respecta a la sensibilidad y especificidad del modelo. No obstante es necesario indicar que en todo caso esta investigación debe entenderse desde una óptica de complementariedad en lugar de sustituibilidad. Finalmente conviene señalar que las conclusiones de esta tesis, particularmente aquellas relacionadas con la determinación de las escalas de equivalencia y la aplicación de curvas ROC, pueden ser fácilmente extrapolables a otros ámbitos estadísticos, que presenten situaciones de similares características a la hora de construir sistemas de indicadores cuantitativos basados en datos empíricos para la toma de decisiones.