Proyecto Nerudaextracción de entidades usando modelos ocultos de Markov

  1. Cuesta Infante, Alfredo
  2. Martín Martín, Diego
  3. Colmenar, José Manuel
  4. Hidalgo Pérez, José Ignacio
  5. Abánades Astudillo, Miguel A.
  6. Poza Saura, Fernando
  7. Herrán González, Alberto
Revista:
Anales de ingeniería técnica en informática de sistemas

Año de publicación: 2010

Número: 3

Páginas: 31-50

Tipo: Artículo

Resumen

La cantidad de información en formato de texto digital ha aumentao a un ritmo inesperado en la última década. Por ello las técnicas de Minería de Textos (Text Mining) han sido objeto de una intensa actividad investigadora. Una de sus tareas consiste en el reconocimiento y correcta clasificación de las palabras en una frase. Las categorías en las cuales una palabra puede ser clasificada se denominan entidades siempre que estas tengan un cierto grado de interés como nombres de personas y lugares o números que representen fechas o cantidades de dinero. Por este motivo dicha tares se suele denominar Extración de Entidades, Named Entity Recognition (NER) en su versión inglesa. Este artículo pretende acercar la materia, sus fundamentos esenciales y las técnicas más exitosas. Además presenta el proyecto NERUDA, un extractor de entidades desarrollado por los investigadores del Instituto Interligare de Innovación en Inteligencia (14); cuyos resultados le sitúan inmediatamente detrás del ganador en la última competición anual de NER.