Medidas de dispersión ordinalaplicaciones a la medición del impacto de etiquetas lingüísticas y a problemas de decisión multicriterio con operadores OWA

  1. Martinez Martin, Nuria
Dirixida por:
  1. Francisco Javier Montero de Juan Director
  2. Daniel Gómez González Director

Universidade de defensa: Universidad Complutense de Madrid

Fecha de defensa: 10 de xaneiro de 2020

Tribunal:
  1. Francisco Javier Yáñez Gestoso Presidente
  2. Luis Garmendia Salvador Secretario
  3. Susana Montes Rodríguez Vogal
  4. Fátima Sánchez Cabo Vogal
  5. José Luis García Lapresta Vogal
Departamento:
  1. Estadística e Investigación Operativa

Tipo: Tese

Resumo

La variabilidad de un conjunto de datos es un concepto amplio y fundamental en Estadística al que se asocian diferentes nombres dependiendo de la disciplina y el contexto (siendo "dispersión" uno de los más usados). Las medidas de dispersión dependen de la naturaleza de los datos. En variables numéricas o en variables cualitativas nominales las medidas a utilizar son claras y aceptadas mientras que en variables cualitativas ordinales no existe una medida comúnmente aceptada. A menudo, la técnica es convertir la variable ordinal en una numérica (suponiendo una escala continua subyacente no existente) o en una variable nominal (ignorando la ordinalidad de los datos), y aplicar entonces medidas de dispersión propias de estos tipos de variables. Esto no es matemáticamente correcto y puede llevar a una interpretación errónea de los resultados. En esta memoria se lleva a cabo un análisis riguroso y una formalización matemática de las medidas de dispersión ordinal encontradas hasta la fecha. Clasificamos estas medidas a partir de una serie de propiedades (algunas existentes, reformuladas con mayor rigurosidad, y otras planteadas de forma novedosa) para entender mejor su comportamiento y definimos además una relación de equivalencia entre ellas. De este análisis obtenemos dos enfoques conceptuales para la dispersión: el que la mide como la discrepancia media entre dos observaciones cualesquiera elegidas al azar y el que la enfoca como el opuesto a la concentración en torno a un punto de referencia (idea similar a la desviación media en datos cuantitativos). Ambas generalizaciones pueden formularse analíticamente de forma muy similar, a saber, como una expresión que combina las frecuencias de las categorías ponderando la diferencia entre ellas (bien entre categorías dos a dos en el caso de la discrepancia media, bien entre cada categoría y la categoría de referencia). Como la escala ordinal carece de la propiedad de distancia entre sus categorías, no pueden realizarse operaciones aritméticas con las mismas. Esto conlleva que el valor de referencia en el segundo enfoque presentado tiene que ser una categoría de la escala (se propone una adaptación de la mediana: la "mediana única") y que la discrepancia entre las categorías ha de venir dada por una matriz que defina los saltos entre cualesquiera dos categorías. En este trabajo, interpretamos esta matriz, analizamos las hipótesis que debe cumplir y proponemos un cálculo semi-automático en función de un vector de pesos. Con esta propuesta, trabajamos con las dos generalizaciones y analizamos las propiedades de las medidas de dispersión introducidas anteriormente. La primera aplicación del uso de estas medidas se hace en el contexto de un experimento para recoger el impacto de la naturaleza de las etiquetas (comparando etiquetas lingüísticas vs. frecuentistas) en una escala ordinal de Likert. Se realiza un análisis en profundidad del que destacamos que las medidas de dispersión ordinal permiten confirmar una asimetría lateral que la entropía no es capaz de recoger. Otras conclusiones relevantes son que la percepción de la etiqueta ¿Muy de acuerdo¿ se corresponde con un rango de etiquetas frecuentistas mayor que cualquier otra etiqueta de la escala lingüística y que detectamos una tendencia a expresar mayor acuerdo con las etiquetas lingüísticas. La segunda aplicación se hace en el contexto de operadores de agregación. Proponemos una nueva familia paramétrica de operadores OWA, los MOOWA (Maximum Ordinal dispersion OWA operators). Se genera maximizando la dispersión ordinal de los vectores asociados a los operadores OWA, en lugar de maximizar la dispersión nominal mediante el uso de la entropía (operadores MEWOA). Comparados con los MEOWA, los MOOWA presentan cálculos mucho más sencillos e intuitivos en la interpretación ya que se trata de una combinación lineal convexa del mejor y el peor criterio cumplidos.