Extracción automática de nexos léxicos

  1. SÁNCHEZ BERRIEL, ISABEL
Dirigida por:
  1. Octavio Santana Suárez Director/a
  2. José Rafael Pérez Aguiar Codirector/a

Universidad de defensa: Universidad de Las Palmas de Gran Canaria

Fecha de defensa: 25 de septiembre de 2015

Tribunal:
  1. Manuel Alvar Ezquerra Presidente
  2. Juan Rocha Martín Secretario/a
  3. Francisco Maciá Pérez Vocal
  4. Antonio Núñez Ordóñez Vocal
  5. Agustín Vera Luján Vocal

Tipo: Tesis

Resumen

Las colocaciones son combinaciones recurrentes de palabras cuyo significado no es totalmente composicional, sino que uno de sus elementos selecciona una aceptación especial en el otro; cabe destacar que el nexo no se establece entre palabras aisladas sino que lo hace entre grupos semánticos. Dentro del campo de la lingüística computacional, el trabajo de investigación se centra en la detección automática de colocaciones léxicas del español – tiene en cuenta tanto el punto de vista lingüístico como el enfoque estadístico. Se procede a la extracción de colocaciones de un corpus extenso mediante técnicas basadas en las frecuencias de palabras –se proporcionan soluciones a la inestabilidad que producen las marcadas diferencias entre las frecuencias de uso de las distintas palabras en el corpus. Se diseña una metodología de análisis centrada en la palabra, y se definen nuevos indicadores; las propuestas se orientan de modo que sean válidas en corpus menos extensos. Se hace necesario también establecer grupos de palabras con cierta similitud semántica, con los que se establece el vínculo; se enfoca el estudio hacia la determinación de clases semánticas entre los elementos que combinan con una determinada palabra. Se opta por adaptar el indicador de asociación de selección (Resnik, 1997), que mide el vínculo entre un grupo de argumentos y su predicado, por medio de los diccionarios ideológicos del español. Como producto de la investigación resulta una herramienta de consulta de la combinatoria del español, especialmente útil para investigaciones lingüísticas.