Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos
- Mª Eugenia Iglesias Moreno 1
- Pilar Azcárate Aguilar-Amat 1
- Sonia Sánchez Cuadrado 1
-
1
Universidad Carlos III de Madrid
info
- López Poza, Sagrario (ed. lit.)
- Pena Sueiro, Nieves (ed. lit.)
Editorial: SIELAE ; Universidade da Coruña
Año de publicación: 2014
Páginas: 229-238
Tipo: Capítulo de Libro
Resumen
En este artículo presentamos los resultados de una evaluación de la anotación de nombres propios de forma automática en un corpus de documentación medieval castellana. Dicha evaluación se ha realizado sobre el etiquetado obtenido con la herramienta de procesamiento de lenguaje natural, Freeling, en dos iteraciones. La primera, con la versión para español estándar y antiguo facilitadas y la segunda con una adaptación propuesta, basada en la solución de los problemas de anotación debidos a las características y variantes que presentan los nombres propios de personas y lugares en español antiguo. Para ambas iteraciones, se ha seleccionado un corpus de anotación de los documentos que componen el Libro Becerro de las Behetrías de Castilla (LBB), del siglo XIV. El nivel de acierto obtenido en la anotación automática de nombres propios con la adaptación propuesta ha sido de 98,23% para el español antiguo, que puede considerarse aceptable para repetir, en un trabajo futuro, el método en el corpus completo.