Arquitectura de un sistema multi-agente para el soporte de la anotación funcional

  1. DIAS XAVIER, DANIELA
Dirigida por:
  1. Rubén Fuentes Fernández Director

Universidad de defensa: Universidad Complutense de Madrid

Fecha de defensa: 23 de noviembre de 2015

Tribunal:
  1. Jorge Jesús Gómez Sanz Presidente
  2. María Guijarro Mata-García Secretaria
  3. Fernando Díaz Gómez Vocal
  4. Antonio Fernández Caballero Vocal
  5. Javier Bajo Pérez Vocal
Departamento:
  1. Ingeniería del Software e Inteligencia Artificial

Tipo: Tesis

Resumen

Predecir la función biológica de secuencias de Ácido Desoxirribonucleico (ADN) es unos de los mayores desafíos a los que se enfrenta la Bioinformática. Esta tarea se denomina anotación funcional y es un proceso complejo, laborioso y que requiere mucho tiempo. Dado su impacto en investigaciones y anotaciones futuras, la anotación debe ser lo más fiable y precisa posible. Idealmente, las secuencias deberían ser estudiadas y anotadas manualmente por un experto, garantizando así resultados precisos y de calidad. Sin embargo, la anotación manual solo es factible para pequeños conjuntos de datos o genomas de referencia. Con la llegada de las nuevas tecnologías de secuenciación, el volumen de datos ha crecido significativamente, haciendo aún más crítica la necesidad de implementaciones automáticas del proceso. Por su parte, la anotación automática es capaz de manejar grandes cantidades de datos y producir un análisis consistente. Otra ventaja de esta aproximación es su rapidez y bajo coste en relación a la manual. Sin embargo, sus resultados son menos precisos que los manuales y, en general, deben ser revisados (curados) por un experto. Aunque los procesos colaborativos de la anotación en comunidad pueden ser utilizados para reducir este cuello de botella, los esfuerzos en esta línea no han tenido hasta ahora el éxito esperado. Además, el problema de la anotación, como muchos otros en el dominio de la Bioinformática, abarca información heterogénea, distribuida y en constante evolución. Una posible aproximación para superar estos problemas consiste en cambiar el foco del proceso de los expertos individuales a su comunidad, y diseñar las herramientas de manera que faciliten la gestión del conocimiento y los recursos. Este trabajo adopta esta línea y propone MASSA (Multi-Agent System to Support functional Annotation), una arquitectura de Sistema Multi-Agente (SMA) para Soportar la Anotación funcional. MASSA integra dos aproximaciones de la Inteligencia Artificial: los Sistemas Expertos Basados en Reglas (SEBR) y los SMA. La primera ayuda a reproducir el razonamiento del experto, mejorando la calidad de la anotación y evitando los inconvenientes en coste de la anotación manual. El SEBR contiene conocimiento en Biología y heurísticas en Bioinformática. La segunda aproximación facilita el manejo de recursos heterogéneos y aprovecha la posibilidad de computación distribuída. Esta combinación permite a MASSA abordar las limitaciones del dominio e inferir anotaciones precisas. Con el objetivo de poder mantener el sistema al día con los constantes cambios del dominio contando con un limitado número de expertos, MASSA ha sido desarrollado con un énfasis especial en su adaptabilidad, evolución, y soporte al trabajo en equipo. Con este propósito, su desarrollo adopta metodologías, prácticas y tecnologías de vanguardia. Por ejemplo, la información de los expertos sobre el dominio se obtuvo mediante técnicas de elicitación del conocimiento y se modeló utilizando la metodología CommonKADS, y los requisitos para la anotación en comunidad se analizaron usando el marco de la Teoría de Actividad. El rendimiento de MASSA fue evaluado con el procedimiento propuesto en la primera Evaluación Crítica de la Anotación Funcional de proteinas (CAFA, Critical Assessment of protein Function Annotation). Fue una comparativa gestionada por la comunidad de expertos y realizada a gran escala. MASSA procesó y anotó las 866 secuencias filogenéticamente diversas (11 especies) de este experimento. Sus anotaciones se compararon con las producidas por los 10 mejores algoritmos presentados en CAFA, siendo las de MASSA más precisas. Otras características de MASSA fueron evaluadas mediante encuestas a expertos, también con resultados positivos. Estos resultados globales apuntan a los beneficios de la arquitectura propuesta y el conocimiento experto considerado.