Corpus Vieweruna plataforma basada en PLN y Aprendizaje Automático para diseño e implementación de política pública

  1. Padilla-Soler, Antonio
  2. Gómez-Verdejo, Vanesa
  3. Pérez-Fernández, David
  4. Arenas-García, Jerónimo
  5. Samy, Doaa
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2019

Número: 63

Páginas: 193-196

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Corpus Viewer es un servicio en producción desarrollado por la Secretaría de Estado del Avance Digital dentro del marco del Plan de Impulso de Tecnologías del Lenguaje (Plan TL). Se basa en técnicas de Procesamiento del Lenguaje Natural (PLN) y Aprendizaje Automático para analizar datos estructurados y no-estructurados en grandes colecciones de documentos como las patentes, las publicaciones científicas de acceso abierto, los proyectos europeos, etc. El objetivo es ofrecer al decisor político y al gestor la posibilidad de navegar en el espacio de la información teniendo una visión de conjunto que le ayude a tomar decisiones basadas en conocimiento y evidencias. En este artículo, se describen las funcionalidades básicas de la plataforma enumerando las técnicas empleadas que incluyen, entre otros, modelados de tópicos y análisis de grafos.

Referencias bibliográficas

  • Blei, D. M. and J. D. Lafferty. 2005. Correlated topic models. In Proc. NIPS.
  • Blei, D. M. and J. D. Lafferty. 2006. Dynamic topic models. In Proc. ICML.
  • Blei, D. M., A. Y. Ng, and M. I. Jordan. 2003. Latent dirichlet allocation. In Proc. NIPS.
  • Greene, D. and J. P. Cross. 2017. Exploring the political agenda of the european parliament using a dynamic topic modeling approach. Political Analysis, 25:77-94.
  • Mikolov, T., I. Sutskever, K. Chen, G. S. Corrado, and J. Dean. 2013. Distributed representations of words and phrases and their compositionality. In Proc. NIPS.