El modelo cortical HTM y su aplicación al conocimiento lingüístico

  1. Arias Rodriguez, Ivan
Dirigée par:
  1. Ana Fernández-Pampillón Cesteros Directrice
  2. Eugenio Ramón Luján Martínez Directeur

Université de défendre: Universidad Complutense de Madrid

Fecha de defensa: 07 mars 2022

Jury:
  1. María Victoria Escandell Vidal President
  2. José Luis Sierra Rodríguez Secrétaire
  3. Juan Manuel Cigarrán Recuero Rapporteur
  4. Pedro Manuel Rangel Santos Henriques Rapporteur
  5. Olga Batiukova Rapporteur
Département:
  1. Lingüística, Estudios Árabes, Hebreos, Vascos y de Asia Oriental

Type: Thèses

Résumé

El problema que aborda este trabajo de investigación es encontrar un modelo neurocomputacional de representación y comprensión del conocimiento léxico, utilizando para ello el algoritmo cortical HTM, que modela el mecanismo según el cual se procesa la información en el neocórtex humano. La comprensión automática del lenguaje natural implica que las máquinas tengan un conocimiento profundo del lenguaje natural, lo que, actualmente, está muy lejos de conseguirse. En general, los modelos computacionales para el Procesamiento del Lenguaje Natural (PLN), tanto en su vertiente de análisis y comprensión como en la de generación, utilizan algoritmos fundamentados en modelos matemáticos y lingüísticos que intentan emular la forma en la que tradicionalmente se ha procesado el lenguaje, por ejemplo, obteniendo la estructura jerárquica implícita de las frases o las desinencias de las palabras. Estos modelos son útiles porque sirven para construir aplicaciones concretas como la extracción de datos, la clasificación de textos o el análisis de opinión. Sin embargo, a pesar de su utilidad, las máquinas realmente no entienden lo que hacen con ninguno de estos modelos. Por tanto, la pregunta que se aborda en este trabajo es si, realmente, es posible modelar computacionalmente los procesos neocorticales humanos que regulan el tratamiento de la información de tipo semántico del léxico. Esta cuestión de investigación constituye el primer nivel para comprender el procesamiento del lenguaje natural a niveles lingüísticos superiores. La hipótesis de trabajo es que es posible aplicar los principios del funcionamiento del neocórtex cerebral según se describen en el modelo de la Memoria Jerárquico Temporal (HTM) propuesta por Jeff Hawkins para explicar los procesos de comprensión y representación de la información léxica. En base a esta hipótesis, la tesis plantea como objetivo general desarrollar un método, compatible con el modelo cortical HTM, para extraer, representar y operativizar el significado intrínseco del léxico del español, y que pueda generalizarse a otras lenguas. Este objetivo se ha desarrollado, de forma más concreta, en dos objetivos específicos: 1) La representación léxica del significado. Se ha trabajado en la creación de representaciones semánticas del léxico español que sean compatibles con el modelo HTM. Estas representaciones de las palabras consisten en vectores de valores binarios que deben ser capaces de captar su significado y su relación con el resto del léxico, hasta el punto de poder utilizarse para realizar una serie de pruebas semánticas que validen su correcto funcionamiento. 2) La operativización con HTM de dichas representaciones semánticas. Se ha estudiado si es viable construir y mantener una memoria léxica dinámica, conforme el modelo HTM, con las representaciones semánticas del vocabulario de una lengua, en particular del español. Concretamente se trata de estudiar si es posible, una vez construida una memoria léxico semántica, la realización de operaciones que implican la comprensión del lenguaje. Además, para la consecución de este objetivo, se ha completado la formalización matemática del modelo HTM, lo que abre una vía para el diseño de nuevos algoritmos y para realizar tareas como la reconstrucción de la entrada en función del estado interno del sistema HTM. La consecución de estos dos objetivos ha permitido extraer conclusiones sobre la viabilidad del modelo HTM para la realización de tareas propias del PLN en las que es necesario que el sistema tenga un cierto nivel de comprensión del texto que procesa.