Una comparación de las estadísticas de bondad de ajuste r1 y m2 para modelos de la teoría de respuesta al ítem

Montaño Espinoza, Rosa Myriam

Una comparación de las estadísticas de bondad de ajuste r1 y m2 para modelos de la teoría de respuesta al ítem

Montaño Espinoza, Rosa Myriam

Dirigida por:

Alberto Maydeu Director/a
María Carmen Ruiz de Villa Director/a

Universidad de defensa: Universitat de Barcelona

Fecha de defensa: 05 de febrero de 2009

Tribunal:

Jordi Ocaña Rebull Presidente/a
Javier Revuelta Menéndez Secretario/a
Pere Joan Ferrando Piera Vocal
Adolfo Hernández Estrada Vocal
Francesc Oliva Cuyàs Vocal

Tipo: Tesis

Teseo: 275691 DIALNET

Resumen

La teoría de respuesta al ítem (TRI) es una ciase de modelos en la cual las respuestas a los ítems de un test dependen de una variable continua no observable denominada rasgo latente, Una vez que el efecto de dicha variable es controlado las respuestas a los ítems son independientes. Al aplicar un modelo es primordial realizar una prueba de bondad de ajuste para evaluar si dicho modelo ajusta bien a los datos y de esta manera validar sus resultados y conclusiones. Los enfoques tradicionales para evaluar la bondad de ajuste de los modelos, tales como el test de razón de verosimilitud o X2 de Pearson son poco adecuados en las aplicaciones de los modelos TRI, puesto que estas aplicaciones involucran datos dispersos y producen p-valores inexactos. Nuevos procedimientos han sido propuestos como una manera de superar las dificultades mencionadas anteriormente. Dichos procedimientos se basan en formas cuadráticas sobre los residuos marginales. El presente trabajo aborda dos de estos nuevos procedimientos, el primero es el test R1 propuesto por Glas (1988) y que describe una estadística de ajuste para el modelo logístico de un parámetro basado en la comparación de las frecuencias observadas y esperadas de los patrones de respuestas condicionadas a la suma de las puntuaciones totales. El segundo, es el test M2 propuesto por Maydeu-Olivares y Joe (2005, 2006) y perteneciente a una familia de tests más generales para hipótesis nulas compuestas para datos discretos multivariantes. Mr basados en estadísticas de información limitada sobre los momentos residuales. En particular M2 está basado en momentos uni y bi-variados, y su distribución asintótica es chi-cuadrado con grados de libertad conocidos. Dos son los principales aportes de este trabajo de tesis de doctorado. Primero se demuestra que ambos test estadísticos pertenecen a una clase de test estadísticos más generales Mk que también han sido propuestos por Joe y Maydeu-Olivares (2008). Un segundo aporte, corresponde a la comparación empírica del rendimiento de los estadísticos R1 y M2 Para ello, se realizó un estudio de simulación que permitió comparar las lasas de error tipo I y tipo II obtenidas con cada uno de los estadísticos. Se simularon distintas condiciones combinando distintos valores del tamaño de los test (10, 15 y 20 ítems), y del tamaño de la muestra (300, 500 y 1000 sujetos). También se analizó la potencia de los tests, tanto de manera asintótica como para muestras finitas, en el primer caso se derivó la potencia bajo una secuencia de alternativas locales para los modelos logísticos de dos y tres parámetros y el modelo de Rasch bidimensional. Los resultados revelaron una superioridad del estadístico M2 mostrando un mejor manejo de las tasas nominales del error tipo I, especialmente en las condiciones en que la muestra es más pequeña (N=300) y el tamaño de los test son más largos (20 ítems), es decir, donde se observa una mayor dispersión en los datos. En cuanto a la potencia de los tests, el estadístico M2 también resultó ser más potente para delectar una incorrecta especificación del modelo.