Juegos markovianos discretosuna aproximación a modelos de desarrollo sostenible
- Rosario Romera Ayllón Director/a
Universitat de defensa: Universidad Carlos III de Madrid
Fecha de defensa: 24 de de març de 2010
- Francisco Javier Prieto Fernández President/a
- Francisco Javier Nogales Martín Secretari/ària
- Nadine Hilgert Vocal
- Juan Antonio Tejada Cazorla Vocal
- Emilio Cerdá Tena Vocal
Tipus: Tesi
Resum
En los últimos años ha aumentado la preocupación por la contaminación ambiental y su relación con el cambio climático. Las Naciones Unidas han promovido numerosas reuniones y cumbres de Jefes de Estados, para intentar llegar a un acuerdo entre todos los países con el objetivo de disminuir las emisiones de CO2 a la atmósfera. Desde el Protocolo de Kyoto en 1997 hasta la conferencia de Copenhague en diciembre del 2009, ponen de manifiesto esta preocupación, así como las dificultades que impiden alcanzar soluciones satisfactorias para todos los países y que a la vez consigan el objetivo de reducción de las emisiones. El contexto teórico en el que estos problemas vienen formulándose desde los años 70 es la Teoría de Juegos. Hasta finales del siglo XX, la mayor parte de los resultados se han obtenido para modelos deterministas, y es en esta primera década del siglo XXI cuando se comienzan a abordar formulaciones estocásticas para problemas particulares en este ámbito de modelos de desarrollo sostenible. El objetivo de esta tesis es proporcionar modelos estocásticos para el control del stock acumulado de contaminación ambiental, formulados como Procesos de Decisión de Markov (MDP) con horizonte finito. En este contexto, un importante paradigma es la minimización del funcional de coste que depende de la evolución del stock de contaminación (sistema) afectado por perturbaciones aleatorias, a lo largo de un horizonte finito de T etapas, esto es, el problema tipo llamado TSO (T-stage stochastic optimization problem). El paradigma del problema tipo TSO es suficientemente general como para poder ser tomado como base de solución de problemas de horizonte infinito, por ejemplo mediante la aplicación de técnicas tipo horizonte en retroceso (receding horizon) o de forma directa mediante algoritmos de iteración de valores. Los escenarios no cooperativos que en Teoría de Juegos proporcionan los equilibrios de Nash, son el punto de partida para los distintos problemas TSO que se abordan en esta tesis. El planteamiento y la solución de los problemas que se formulan al asumir comportamientos cooperativo y no cooperativo de los jugadores (países), así como la posibilidad de utilizar alicientes monetarios, llamados transferencias, para incentivar la cooperación, son los resultados presentados en los Capítulos 2 y 3 de esta tesis. En la idea de proporcionar a cada país estrategias que le permitan tomar decisiones que se aproximen al óptimo internacional, esto es al óptimo cooperativo, se formula un novedoso criterio probabilístico de optimización, que difiere del habitual basado en la minimización del valor esperado de un cierto funcional de coste, que es el estandar para problemas Markovianos de decisión. Los problemas de optimización derivados de este planteamiento y sus resultados se presentan en el Capítulo 4. Para ilustrar la modelización de los problemas de optimización estocástica abordados en la tesis, se ha utilizado un mismo ejemplo numérico basado en datos reales, que presenta seis países o regiones como jugadores con un horizonte de 40 años y cuyos datos iniciales se han tomado en 1990, base de la comparación del Protocolo de Kyoto. Es bien conocido que para los MDP, su solución analítica puede hallarse, sólo en algunos casos sencillos. La metodología más habitual para aproximar la solución desarrollando técnicas numéricas con un coste computacional razonable, se obtienen mediante técnicas de Programación Dinámica (aproximada), y esta es la metodología utilizada en este trabajo. Los códigos desarrollados para la obtención de los escenarios aleatorios que han permitido evaluar las soluciones de ciclo cerrado, como corresponde a problemas de decisión markovianos, han sido específicamente obtenidos en Matlab para cada uno de los problemas estudiados en esta tesis.