Inferencia estadística con delta-récords

Maldonado Guaje, Lina Patricia

Inferencia estadística con delta-récords

Maldonado Guaje, Lina Patricia

Zuzendaria:

Gerardo Sanz Sáiz Zuzendaria
Francisco Javier López Lorente Zuzendaria

Defentsa unibertsitatea: Universidad de Zaragoza

Fecha de defensa: 2016(e)ko urtarrila-(a)k 28

Epaimahaia:

Leandro Pardo Llorente Presidentea
María Angeles Gil Alvarez Idazkaria
Raúl Gouet Bañares Kidea

Mota: Tesia

Teseo: 402217 DIALNET

Laburpena

Los récords se encuentran inmersos en nuestra realidad, prácticamente en todos los campos. Es posible encontrarlos en el ámbito deportivo -donde superar una marca en alguna especialidad es naturalmente representado en términos de récords-, o en otras áreas completamente distintas como la meteorología (el día más caluroso o el día más frío entre todos los registrados) o la sismología, áreas en las que desempeñan un papel fundamental en la percepción general de temas como el cambio climático y los desastres naturales (inundaciones y terremotos). Por esto, los récords y los tiempos en que estos ocurren (tiempos en los que el récord actual se “rompe” y es reemplazado por uno nuevo), han sido de gran interés a lo largo de la historia, de allí la naturalidad de tratar el estudio de récords en un sentido estadístico. Una observación se denomina récord si su valor excede al de todas las observaciones anteriores. La dificultad de utilizar récords para aplicaciones radica en la escasez de estos. El desarrollo de técnicas de inferencia estadística usando récords siempre conducirá a enfrentar el estudio de muestras pequeñas. Se han desarrollado definiciones relacionadas con los récords como extensiones de este concepto. La definición de récords débiles (Weak records) fue desarrollada por Vervaat [14] como una modificación del concepto de récord para distribuciones discretas. El concepto de delta-récord fue desarrollado por Gouet et al. [7] como una generalización de los récords clásicos. Una observación es un delta-récord si es mayor que el máximo previo anterior más un valor fijo delta (positivo o negativo). Esta definición es lo suficientemente sencilla como para permitir un análisis riguroso de sus propiedades matemáticas, entre las que se encuentra el comportamiento asintótico de su proceso de conteo; ver Gouet et al. [7, 8]. Además de ser una generalización natural de los récords, los delta-récords están relacionados con otros conceptos existentes como los récords delta-exceedance [4], récords epsilon-repeated [11] y récords cercanos (near-records) [5]. Dado que, para delta menor o igual a 0, cada récord también es un delta-récord y adicionalmente, las observaciones no récords dentro de una distancia −delta del récord actual son también consideradas delta-récords, un delta-récord es una observación que, o es un récord o no alcanza pero está cerca de serlo, por esto es natural considerar estas observaciones como buenos candidatos para mejorar la inferencia con récords. En Gouet et al. [8] se desarrolla la estimación máximo verosímil de los parámetros de la distribución exponencial y Weibull basados en delta-récords, obteniendo mejores resultados que cuando se usan sólo récords. El objetivo de esta tesis doctoral está destinado a contribuir en esa dirección, estudiando la inferencia que se puede realizar cuando en una muestra disponemos de los delta-récords en lugar de exclusivamente los récords. Para ello mostraremos cómo se puede incorporar la información de los delta-récords para hacer las estimaciones y compararemos la calidad de los estimadores propuestos usando delta-récords con los obtenidos usando récords. Estudiaremos tanto el enfoque clásico frecuentista como el Bayesiano y analizaremos distribuciones discretas (especialmente la geométrica) y continuas y desarrollaremos nuestras inferencias tanto en un contexto paramétrico como en uno no paramétrico. La memoria está estructurada en cuatro capítulos y un apartado de conclusiones y trabajos futuros. En la primera parte del capítulo 1 se introducen los conceptos elementales de la teoría de récords y la notación que se utilizará a lo largo de la memoria. Todos los detalles de los conceptos básicos de récords los podemos encontrar en libros como Ahsanullah [1] (1995), Arnold et al. [3] (2011), Nevzorov [12] (2001), Gulati y Padgett [10] (2003), y la incorporación más reciente Ahsanullah y Nevzorov [2] (2015). Cualquiera de estos libros ofrecen estudios específicos sobre teoría de récords. En el capítulo 2, se presentan diferentes métodos de estimación desde el punto de vista frecuentista y Bayesiano para el parámetro de la distribución geométrica, utilizando delta-récords. Se desarrolla la estructura probabilística y se calcula la verosimilitud de la muestra basada en delta-récords. Se muestran varios métodos de estimación del parámetro p como máxima verosimilitud -caso en el que se determina la consistencia y sesgo del estimador-, estimación Bayes y estimación Empírico Bayes. La predicción de los futuros récords usando la información contenida en los delta-récords es considerada tanto con predicción máximo verosímil como Bayesiana. Asimismo se analiza la predicción puntual y por intervalos. En la última sección se utilizan los métodos de estimación y predicción, anteriormente descritos y desarrollados, en datos reales. En todas las situaciones estudiadas se muestra cómo la incorporación de delta-récords mejora el estudio con sólo récords. Esta afirmación, que puede parecer obvia al estar trabajando con mayor información, debe analizarse en el contexto de la escasez de récords. Así, se muestra que las estimaciones basadas en delta-récords asociados a un número reducido de récords, proporcionan mejores estimaciones que aquellas basadas sólo en un número mayor de récords, cuya obtención, como se ha dicho anteriormente, es más costosa debido a su escasez. Resultados en este sentido pueden verse en [9]. En el capítulo 3, se consideran diferentes métodos de estimación máximo verosímil, Bayesiano y empírico Bayes, así como la predicción de futuros récords por método de máxima verosimilitud y Bayesiano, pero ahora en distribuciones continuas: exponencial, Pareto y Weibull. Al final de cada sección, al igual que en el caso geométrico, se presentan resultados numéricos con datos reales y simulados, con el fin de evaluar el desempeño de los estimadores y predicciones estudiadas. El capítulo 4 está dedicado a la estimación no paramétrica usando delta-récords. En el caso de modelos no paramétricos tanto Samaniego y Whitaker [13] como Berger y Gulati [6] establecen que una sola muestra de récords no provee suficiente información para hacer buenas y eficientes estimaciones. En este trabajo, se propone la utilización de los valores delta-récords para realizar estimación no paramétrica de la función de riesgo (hazard function), tanto en el caso de distribuciones discretas como en continuas y se establece, en contraposición a [6] y [13], que se puede considerar sólo una muestra de récords y sus delta-récords para ajustar la función de riesgo con buenos resultados en varias distribuciones. [1] Ahsanullah, M. (1995). Record Statistics. Nova Science Publishers, Incorporated, New York. [2] Ahsanullah, M. and Nevzorov, V. B. (2015). Records via Probability Theory, volume 6. Springer, New York. [3] Arnold, B. C., Balakrishnan, N., and Nagaraja, H. N. (2011). Records, volume 768. Wiley, New York. [4] Balakrishnan, N., Balasubramanian, K., and Panchapakesan, S. (1996). delta-exceedance records. Journal of Applied Statistical Science, 4(2-3):123– 132. [5] Balakrishnan, N., Pakes, A. G., and Stepanov, A. (2005). On the number and sum of near-record observations. Advances in Applied Probability, 37(3):765–780. [6] Berger, M. y Gulati, S. (2001). Record-breaking data: a parametric comparison of the inverse-sampling and the random-sampling schemes. Journal of Statistical Computation and Simulation, 69(3):225-238. [7] Gouet, R., López, F. J., and Sanz, G. (2007). Asymptotic normality for the counting process of weak records and delta-records in discrete models. Bernoulli, 13(3):754–781. [8] Gouet, R., López, F. J., and Sanz, G. (2012). On delta-record observations: asymptotic rates for the counting process and elements of maximum likelihood estimation. Test, 21(1):188–214. [9] Gouet, R., López, F. J., Maldonado, L. P., y Sanz, G. (2014). Statistical inference for the geometric distribution based on delta-records. Computational Statistics & Data Analysis, 78:21-32. [10] Gulati, S. and Padgett, W. J. (2003). Parametric and nonparametric inference from record-breaking data, volume 172. Springer, New York. [11] Khmaladze, E., Nadareishvili, M., and Nikabadze, A. (1997). Asymptotic behaviour of a number of repeated records. Statistics & Probability Letters, 35(1). [12] Nevzorov, V. B. (2001). Records: mathematical theory, volume 194. American Mathematical Soc., Providence, Rhode Island. [13] Samaniego, F. J. y Whitaker, L. R. (1988). On estimating population characteristics from record-breaking observations ii. nonparametric results. Naval Research Logistics (NRL), 35(2):221-236. [14] Vervaat, W. (1973). Limit theorems for records from discrete distributions. Stochastic Processes and their Applications, 1(4):317 – 334.