Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos

Mª Eugenia Iglesias Moreno; Pilar Azcárate Aguilar-Amat; Sonia Sánchez Cuadrado

Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos

Mª Eugenia Iglesias Moreno ¹
Pilar Azcárate Aguilar-Amat ¹
Sonia Sánchez Cuadrado ¹

1 Universidad Carlos III de Madrid

Universidad Carlos III de Madrid

Madrid, España

ROR https://ror.org/03ths8210

Libro:

Humanidades Digitales: desafíos, logros y perspectivas de futuro

López Poza, Sagrario (ed. lit.)
Pena Sueiro, Nieves (ed. lit.)

Editorial: SIELAE ; Universidade da Coruña

Año de publicación: 2014

Páginas: 229-238

Tipo: Capítulo de Libro

DIALNET GOOGLE SCHOLAR Dialnet editor

Resumen

En este artículo presentamos los resultados de una evaluación de la anotación de nombres propios de forma automática en un corpus de documentación medieval castellana. Dicha evaluación se ha realizado sobre el etiquetado obtenido con la herramienta de procesamiento de lenguaje natural, Freeling, en dos iteraciones. La primera, con la versión para español estándar y antiguo facilitadas y la segunda con una adaptación propuesta, basada en la solución de los problemas de anotación debidos a las características y variantes que presentan los nombres propios de personas y lugares en español antiguo. Para ambas iteraciones, se ha seleccionado un corpus de anotación de los documentos que componen el Libro Becerro de las Behetrías de Castilla (LBB), del siglo XIV. El nivel de acierto obtenido en la anotación automática de nombres propios con la adaptación propuesta ha sido de 98,23% para el español antiguo, que puede considerarse aceptable para repetir, en un trabajo futuro, el método en el corpus completo.

Fuente de los datos: Dialnet

Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos

Universidad Carlos III de Madrid

Resumen