Aplicación de distintos sistemas de codificación en la búsqueda bibliográfica de enfermedades raras

  1. Rivas Gayo, Marta
Dirigida per:
  1. Verónica Alonso Ferreira Director/a
  2. Juan Antonio Martínez Comeche Director

Universitat de defensa: Universidad Complutense de Madrid

Fecha de defensa: 19 de de desembre de 2018

Tribunal:
  1. Carlos Manuel da Costa Carballo President
  2. Sonia Sánchez Cuadrado Secretària
  3. Ana Chacón García Vocal
  4. Pablo De Miguel Bohoyo Vocal
  5. Ángel Gil de Miguel Vocal
Departament:
  1. Biblioteconomía y Documentación

Tipus: Tesi

Resum

En este trabajo se pretende mejorar la visibilidad de las llamadas Enfermedades Raras (ER), mediante técnicas documentales de búsqueda bibliográfica. Las ER afectan a menos de 5 por cada 10.000 personas en la Unión Europea. Suelen ser niños que nacen con la patología o la desarrollan a muy temprana edad. Su diagnóstico es muy complejo por los distintos factores que intervienen y en muchos casos las patologías son tan graves que llegan a ser incompatibles con la vida. Debido a su baja prevalencia, su dispersión geográfica, su baja supervivencia, la complejidad y variabilidad de sus presentaciones clínicas y las diferentes y múltiples nominaciones para una misma enfermedad, la investigación de ER supone un reto adicional y es difícil disponer de bases de datos con número suficiente de casos para llegar a respuestas clínicas que pudieran servir para el diagnóstico, tratamiento y control de estas enfermedades. El objetivo principal es aplicar distintos sistemas de codificación para la búsqueda bibliográfica de información relacionada con ER. Los objetivos secundarios son: elaborar un mapeo orientado a ER en el que se relacionen términos de identificación de la enfermedad y códigos empleados en el ámbito sanitario, con códigos para la búsqueda bibliográfica de artículos científicos; explorar las posibilidades que ofrece la búsqueda bibliográfica especializada sobre ER utilizando códigos MeSH frente a las búsquedas tradicionales de términos libres o nombre de enfermedad; y, por último, revisar los artículos obtenidos en ambas búsquedas y comparar si las búsquedas por MeSH suponen una ventaja en cuanto al número de artículos válidos. La metodología usada parte de la descarga de la base de datos de ORPHANET (versión de noviembre de 2016) depurada para elegir únicamente las ER que cumplen la condición de tener código CIE-10 y MeSH. Se obtiene un listado de 1.576 enfermedades que cumplen este criterio y se cruza con el mapeo elaborado por mí, para mi Trabajo de Fin de Máster. A continuación, se desarrolla un mapeo entre los sistemas de clasificación anteriormente mencionados. Ese mapeo se utiliza para hacer búsquedas en PUBMED de una selección de 21 patologías, tanto por literal como por MeSH, viendo qué artículos de estas búsquedas son válidos para la investigación (tratan la enfermedad) y cuáles no son válidos para la investigación porque solo la mencionan. A continuación, se analizan los resultados, obteniendo que se ofrecen prácticamente las mismas respuestas en las búsquedas por literal que en las búsquedas por MeSH. En su mayor parte los artículos emanados de las búsquedas sí presentan la enfermedad. Son pocos los casos en los que solo se menciona la enfermedad. Por último, en un caso de búsquedas por literal y otro por MeSH no se obtiene ningún resultado. Al ser una diferencia tan mínima entre una y otra búsqueda, no importa qué método se utilice para la búsqueda. Del análisis efectuado se concluye que, aunque de una manera muy poco representativa, MeSH ofrece mejores resultados. En los resultados se observan diferencias individuales significativas, aunque la diferencia global es mínima. Otra de las conclusiones de este trabajo es que, en algunas patologías, la utilización de códigos MeSH ofrece mejores resultados que la búsqueda por literal. También se demuestra que como pareciera lógico los resultados obtenidos para las enfermedades que devuelven menos artículos el comportamiento es más errático en el resultado de las búsquedas bibliográficas, que en las enfermedades que devuelven más artículos en las que el comportamiento es más homogéneo. Dado que la eficacia de estas búsquedas bibliográficas es del 71% lo que supone un importante ruido documental (29%) parece razonable explorar otros mecanismos que mejoren estos resultados y puedan ofrecer mayor nivel de certeza, como pueden ser sistemas inteligentes basados en tecnología Big Data y en las posibilidades que ofrece ¿el aprendizaje de máquina o machine learning¿.