Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos

  1. Mª Eugenia Iglesias Moreno 1
  2. Pilar Azcárate Aguilar-Amat 1
  3. Sonia Sánchez Cuadrado 1
  1. 1 Universidad Carlos III de Madrid
    info

    Universidad Carlos III de Madrid

    Madrid, España

    ROR https://ror.org/03ths8210

Libro:
Humanidades Digitales: desafíos, logros y perspectivas de futuro
  1. López Poza, Sagrario (ed. lit.)
  2. Pena Sueiro, Nieves (ed. lit.)

Editorial: SIELAE ; Universidade da Coruña

Año de publicación: 2014

Páginas: 229-238

Tipo: Capítulo de Libro

Resumen

En este artículo presentamos los resultados de una evaluación de la anotación de nombres propios de forma automática en un corpus de documentación medieval castellana. Dicha evaluación se ha realizado sobre el etiquetado obtenido con la herramienta de procesamiento de lenguaje natural, Freeling, en dos iteraciones. La primera, con la versión para español estándar y antiguo facilitadas y la segunda con una adaptación propuesta, basada en la solución de los problemas de anotación debidos a las características y variantes que presentan los nombres propios de personas y lugares en español antiguo. Para ambas iteraciones, se ha seleccionado un corpus de anotación de los documentos que componen el Libro Becerro de las Behetrías de Castilla (LBB), del siglo XIV. El nivel de acierto obtenido en la anotación automática de nombres propios con la adaptación propuesta ha sido de 98,23% para el español antiguo, que puede considerarse aceptable para repetir, en un trabajo futuro, el método en el corpus completo.