Estrategia de interoperabilidad semántica en el contexto de integración de conocimiento geográfico y ambiental. Caso de aplicaciónRed ontológica “BiodiversityOntology”

  1. Mejia Avila, Doris
Dirigida por:
  1. Antonio Vázquez Hoehne Director/a
  2. Luis Manuel Vilches Blazquez Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 08 de noviembre de 2011

Tribunal:
  1. José Luis Tellería Jorge Presidente
  2. Mikel Egaña Aranguren Secretario/a
  3. Cristina Zamorano Chico Vocal
  4. Francisco Palomares Fernández Vocal
  5. José Luis Viejo Montesinos Vocal

Tipo: Tesis

Resumen

Esta tesis destaca la importancia de la interoperabilidad semántica en el proceso de homogenización, estructuración e integración del conocimiento en los dominios geográfico y ambiental. El objetivo de la presente investigación es formular una estrategia que contribuya a la síntesis, conceptualización e integración del conocimiento asociado a las ciencias ambientales y geográficas, usando como referencia el conocimiento de biodiversidad y como herramienta en el contexto de la interoperabilidad semántica las ontologías. La formulación de esta estrategia se justifica desde el contexto del tipo de conocimiento al cual va dirigida. El conocimiento asociado a las aplicaciones en dominios como la Geografía y las Ciencias Ambientales (englobadas en el marco de esta investigación como “aplicaciones temáticas geoespaciales”), se puede tipificar como complejo, dado que su entendimiento requiere de procesos tales como: integración de información a partir de varias fuentes; generación de inferencias; conexión de nueva información con el conocimiento existente y coordinación de diferentes representaciones y perspectivas como por ejemplo la síntesis a diferentes escalas espaciales y temporales. La complejidad del conocimiento asociado a estos dominios determina su naturaleza de dispersión, lo que a su vez se refleja en la falta de integración de la información. La estrategia de interoperabilidad semántica está conformada por tres componentes:1) la formulación de una metodología para adquisición de conocimiento en el contexto del desarrollo de ontologías para aplicaciones asociadas a los dominios geográfico y ambiental, la cual ha sido denominada ACATGeo, 2) el desarrollo de ontologías o redes ontológicas para una aplicación temática asociada a los dominios mencionados, mediante la combinación de la metodología ACATGeo y una metodología para construcción de ontologías y 3) el uso de las ontologías desarrolladas como medio para generar documentos RDF de integración de datos procedentes de diferentes bases de datos. La combinación de estos tres componentes se convierte en un protocolo que puede ser replicado en el contexto de cualquier aplicación temática asociada a los dominios geográfico y ambiental. Dadas las características del conocimiento asociado a este tipo de aplicaciones y teniendo en cuenta la generalidad con la cual se aborda el proceso de adquisición de conocimiento en el contexto de las actuales metodologías para construcción de ontologías, se propone como primer componente de la estrategia, la formulación de la metodología ACATGeo (adquisición de conocimiento en el marco de desarrollo de ontologías para aplicaciones temáticas geoespaciales). La aplicación de ACATGeo permitirá sintetizar y conceptualizar conocimiento que trasciende varios dominios y se sintetiza a diferentes escalas espaciales y temporales. Este conocimiento será estructurado en tres elementos: un Marco Conceptual Integrado (MCI) de conocimiento, un glosario de términos y un modelo de datos. Estos elementos servirán de base para la formalización del conocimiento en una ontología. Esta estrategia de interoperabilidad semántica fue probada para la integración de conocimiento en el dominio de la biodiversidad. Mediante la aplicación de la metodología ACATGeo, se centralizó, sintetizó y conceptualizó el conocimiento asociado a la evaluación del estado de conservación a nivel de especie y de ecosistema a diferentes escalas espaciales. El conocimiento conceptualizado fue formalizado, obteniéndose la red ontológica denominada BiodiversityOntology. Para la construcción de esta red, además de la metodología ACATGeo fue utilizada la metodología NeOn para desarrollo de redes ontológicas. Se establecieron las correspondencias entre la red BiodiversityOntology y cuatro bases de datos de biodiversidad para obtener documentos RDF de integración de datos de biodiversidad. Esta investigación constituye una aportación en el ámbito de la estructuración de conocimiento asociado a las aplicaciones temáticas para los dominios de la Geografía y las Ciencias Ambientales. La metodología ACATGeo es una contribución al desarrollo metodológico en el contexto de las ontologías, porque profundiza en los procesos de adquisición de conocimiento para construcción de ontologías, con el fin de que se ajusten a dominios más específicos. ABSTRACT This PhD thesis highlights the importance of the semantic interoperability in the process of harmonization, structuring and integration of the knowledge in geographical and environmental domains. The objective of this research is to formulate a strategy that contributes to the synthesis, conceptualization and integration of knowledge associated with geographical and environmental science. This strategy uses knowledge of Biodiversity as a reference and the ontologies as tools in the context of semantic interoperability. The formulation of this strategy is justified from the context of the type of knowledge to which it is directed. The knowledge associated to geographical and environmental applications (called in the framework of this research “geospatial thematic applications”) can be categorized as complex because its understanding requires different processes such as: integrating information from different sources; generating inferences; linking the new information with the existing knowledge and coordinating different representations and perspectives like for example the synthesis at different spatial and temporal scales. The complexity of the knowledge associated to these domains determines its nature of dispersion, which in turn reflects the lack of information integration. The strategy of semantic interoperability is made up of three components: 1) the formulation of a methodology for the knowledge acquisition in the context of the development of ontologies for the geographical and environmental applications. This methodology has been called ACATGeo, 2) the development of ontologies or ontological networks for a thematic application associated to the domains mentioned before, through the combination of the ACATGeo methodology and a methodology for the ontology building, and 3) the use of such ontologies as a mean to generate RDF documents of integration of data from different databases. The combination of these three components is in itself a protocol that can be replicated in the context of any thematic application associated with geographical and environmental domains Given the complexity of knowledge associated with geospatial thematic applications, and taking into account the superficiality in the process of knowledge acquisition in current methodologies for building ontologies, the formulation of the methodology ACATGeo (knowledge acquisition in the ontology development framework for geospatial thematic applications) is proposed as the first component of the semantic interoperability strategy: The application of ACATGeo allows to synthesize and conceptualize the knowledge that transcends various domains and that is synthesized at different spatial-temporal scales. This knowledge was structured in three elements: an Integrated Conceptual Framework of the knowledge, a glossary of terms and a data model. Those elements were the basis for the formalization of the knowledge in ontological network. This strategy of semantic interoperability was proved for the knowledge integration in the domain of Biodiversity. By applying the methodology ACATGeo, the knowledge associated with the conservation status assessment to species and ecosystems at different spatial scales was centralized, synthesized and conceptualized. This knowledge was formalized, obtaining the ontological network called BiodiversityOntology. To build this network, the NeOn methodology for the ontological networks building was used, besides the ACATGeo methodology. There were set the correspondences between the BiodiversityOntology network and four biodiversity databases to obtain RDF documents of integration of biodiversity data. This research is a contribution in the field of structuring of the knowledge associated to the thematic applications for the domains of Geography and the Environmental Sciences. The ACATGeo methodology is a contribution to the methodological development in the context of the ontologies. It deepens in the processes of knowledge acquisition to adapt them to specific domains.