Algunas aportaciones a la toma de decisiones en clasificación supervisadaun enfoque bipolar

  1. Villarino Martinez, Guillermo
Dirigida por:
  1. Daniel Gómez González Director
  2. Juan Tinguaro Rodríguez González Director
  3. Rosario Cintas del Río Directora

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 21 de noviembre de 2019

Tribunal:
  1. Francisco Javier Montero de Juan Presidente
  2. Rafael Caballero Roldán Secretario
  3. Susana Cubillo Villanueva Vocal
  4. Luis Magdalena Layos Vocal
  5. Alberto Fernández Hilario Vocal
Departamento:
  1. Estadística y Ciencia de los Datos

Tipo: Tesis

Resumen

Las aplicaciones de la Ciencia de Datos y la Inteligencia Artificial adquieren cada vez mayor relevancia en el mundo actual. Como muchas de estas aplicaciones influyen en los procesos de toma de decisiones, en los que los decisores humanos asumen la responsabilidad de la decisión final y sus consecuencias, también existe una creciente necesidad de hacer de los seres humanos el centro del análisis de los datos. En este sentido, la interpretabilidad cobra especial importancia y, en el esfuerzo por adaptarse más a las características y la naturaleza de los humanos, los métodos de la ciencia de la información también deben tener en cuenta: i) que los humanos se comunican de manera eficiente por medio del lenguaje natural, en el que los conceptos generalmente poseen una naturaleza imprecisa e incierta; y ii) que el razonamiento humano y la toma de decisiones típicamente se basan en un balance de informaciones de carácter positivo y negativo, es decir, tienen una naturaleza dicotómica o bipolar. En esta memoria se exploran diversos métodos para la incorporación de un marco de bipolaridad en algoritmos de clasificación supervisada de naturaleza soft, entendiendo esta clase de algoritmos como aquellos que devuelven una puntuación en la etapa previa a la toma final de decisiones, en contraposición a los algoritmos de naturaleza puramente nítida, en los que se asigna a cada observación una clase predefinida. La incorporación de este marco bipolar, permiten dotar al clasificador de una mayor flexibilidad al considerar distintas evidencias sobre la pertenencia de un objeto a cierta clase. Se proponen en este trabajo dos grandes grupos de aproximaciones a Nivel Global, esto es, susceptibles de aplicación en la etapa final de toma de decisiones de cualquier clasificador, para abordar este problema. Por un lado, las que están orientadas a la consideración de clasificadores probabilísticos, esto es, cuya evidencia viene dada en forma de probabilidad. Por otro, aquellas cuyo objetivo es aprovechar la información dada por clasificadores de tipo fuzzy o difuso, dada en este caso por grados de pertenencia difusos con distintas propiedades que las probabilidades. Se destaca que estos métodos a Nivel Global son susceptibles de aplicación a cualquier algoritmo de clasificación de naturaleza soft. En el contexto de los algoritmos difusos y, concretamente sobre los Sistemas de Clasificación Basados en Reglas Difusas (SCBRDs), se desarrolla un paradigma bipolar a Nivel Local o de reglas, que permite representar el conocimiento presente en la base de reglas de la clasificación. Por tanto, es este un método que, por ahora, se encuentra restringido al marco de los SCBRDs teniendo, no obstante, gran proyección debido a sus buenas propiedades. Un completo marco teórico de los diferentes enfoques bipolares considerados se desarrolla aquí con el objetivo de proporcionar un esquema matemático flexible, susceptible de aplicación bajo distintas configuraciones paramétricas e incluso modificaciones en pos de la adaptación a un contexto determinado. Además, algunas configuraciones paramétricas se evalúan a través de estudios experimentales rigurosos en conjuntos de datos de la vida real para evaluar el comportamiento del esquema bipolar en el contexto de la clasificación supervisada. Como conclusión general de este trabajo, la consideración de un marco bipolar en el contexto de los algoritmos de clasificación en Data Science constituye una solución adecuada para hacer frente a las tareas de asignación de clases, lo que permite al clasificador aprovechar una estructura de evidencia pareada y, por lo tanto, otorgar al clasificador un proceso de toma de decisiones con mayor flexibilidad. En cuanto al paradigma a Nivel local propuesto en el marco de los SCBRDs, se evidencia una sinergia positiva entre estos dos métodos de representación de conocimiento basados en el ser humano, abriendo así una línea interesante de investigación futura.