Robust Statistical and Artificially Intelligent Approaches for the Analysis of 2D and 3D Morphological Data

  1. Courtenay, Lloyd Austin David
Zuzendaria:
  1. Diego González Aguilera Zuzendaria
  2. José Yravedra Sainz de los Terreros Zuzendarikidea

Defentsa unibertsitatea: Universidad de Salamanca

Fecha de defensa: 2023(e)ko otsaila-(a)k 09

Epaimahaia:
  1. Julia Aramendi Presidentea
  2. Susana del Pozo Aguilera Idazkaria
  3. Francesco Boschin Kidea

Mota: Tesia

Laburpena

Las nociones de geometría y morfología son un componente fundamental del modo en que percibimos, describimos y esencialmente interactuamos con los objetos. La forma y el tamaño de un elemento pueden ser altamente informativos, y condicionan el modo en que realizamos funciones básicas en nuestra vida cotidiana. La morfología puede ser útil para; la detección de anomalías y patrones, la caracterización de un objeto u organismo, así como la identificación de la casualidad (causa y efecto). Sin embargo, encontrar un acercamiento eficaz y objetivo de caracterizar la morfología de los elementos micro y macroscópicos suele ser un gran reto en muchos campos de la ciencia. Aunque muchos enfoques de este tipo de tareas se han basado durante mucho tiempo en una descripción visual o cualitativa de la forma, lamentablemente la mayoría de estos métodos están influenciados por notables grados de subjetividad, típicamente producto del error humano y dependiente de la experiencia y el conocimiento. En la presente Tesis Doctoral, se explora una amplia gama de diferentes técnicas para la extracción y el análisis de datos morfológicos. En concreto, los principales objetivos de este estudio son definir un flujo de trabajo general que pueda ser utilizado para la cuantificación de diferentes elementos, con la esperanza de desarrollar un enfoque transparente e transdisciplinar que pueda aplicarse a muchos campos de la ciencia. Para ello, se han utilizado múltiples técnicas de digitalización de datos tanto en 2D como en 3D, entre ellas (por orden de prevalencia): escaneo de superficies con luz estructurada, tomografía microcomputada, microscopía digital 3D y la fotografía para la obtención de imágenes clínicas. A continuación, se investigó cuál era el mejor medio para extraer información morfológica, principalmente mediante análisis de Morfometría Geométrica, aunque también se probaron combinaciones de análisis métricos tradicionales y avanzados basados en análisis de Fourier elípticos. A raíz de esto, la presente Tesis Doctoral dedica una parte importante de la investigación a la búsqueda de los mejores medios de análisis estadístico de este tipo de información. Más concretamente, se emplea el uso de múltiples enfoques estadísticos robustos, así como pruebas paramétricas y no paramétricas, con el fin de obtener la mayor precisión posible en las conclusiones extraídas. Con el fin de aprovechar esta información para tareas como la clasificación o el diagnóstico, esta Tesis Doctoral también presta gran atención al uso del Aprendizaje Computacional para el desarrollo de algoritmos de la Inteligencia Artificial en tareas de toma de decisiones. Sin embargo, antes del desarrollo de algoritmos de clasificación, la investigación profundizó en las posibles limitaciones presentes en la ciencia de datos. A saber, los problemas debidos al tamaño de la muestra y la "maldición de la dimensionalidad". Para superar estas limitaciones, se desarrollaron diferentes líneas de investigación; primero explorando la multitud de técnicas disponibles para el aumento de datos y la simulación; seguido por la experimentación con diferentes tipos de algoritmos para tareas de clasificación. Los resultados obtenidos en este estudio revelan que muchas técnicas diferentes son útiles para el modelado, extracción y estudio de la información morfológica. Aquí se ha demostrado en una variedad de diferentes escenarios diferentes cómo, especialmente cuando se combinan con enfoques estadísticos robustos, tanto la morfometría geométrica y los análisis de Fourier elípticos son herramientas poderosas para la descripción de la forma. A lo largo de esta investigación, la simulación de datos también ha demostrado ser un paso fundamental en el flujo de trabajo, proporcionando mediante técnicas de inteligencia artificial (ej. redes neuronales, máquina de soporte de vectores) información suficiente para la identificación de nuevos especímenes. Con el fin de promover la transparencia y mejorar la reproducibilidad, la presente Tesis Doctoral también va acompañada de una amplia colección de código abierto, conjuntos de datos y diferentes programas informáticos. La aplicabilidad de estos enfoques metodológicos, y por tanto, su carácter transdisciplinar, ha quedado demostrado a través de múltiples casos de estudio validados con éxito. Entre ellos se incluyen aplicaciones en arqueología y paleontología, la paleoantropología, el bienestar animal, y la dermatología. A través de este compendio de artículos de investigación, los métodos presentados han sido capaces de contribuir con una serie de características en cada uno de estos campos. Estas van desde la capacidad de identificar taxones de carnívoros extintos en yacimientos arqueológicos basándose en sus marcas dentales, hasta la primera cuantificación empírica de la asimetría de las lesiones cutáneas como herramienta de diagnóstico en oncología dermatológica. Además, mediante la presentación de un nuevo modelo matemático para la descripción de la morfología, este estudio ha sido capaz de proporcionar un nuevo medio, más eficiente, de extraer información biomecánica de los huesos largos de las extremidades de los grandes primates. En definitiva, cada uno de estos descubrimientos presenta prometedoras ventajas para el estudio de otros tipos de datos morfológicos. La presente Tesis Doctoral pretende, por tanto, aportar una nueva perspectiva sobre los medios con los que se puede estudiar la morfología de diferentes elementos, promoviendo un enfoque más robusto y transdisciplinar. Por ello, las investigaciones futuras se centrarán en aplicar estas técnicas a otros campos de la ciencia, al tiempo que permitan trabajar en el ajuste de este flujo de trabajo metodológico para obtener una mayor precisión y exactitud.