Métodos de clustering en datos de expresión génica

Torrente Orihuela, Ester Aurora

Métodos de clustering en datos de expresión génica

Torrente Orihuela, Ester Aurora

Dirigida por:

Alvis Brazma Director/a
Juan José Romo Urroz Director

Universidad de defensa: Universidad Carlos III de Madrid

Fecha de defensa: 22 de junio de 2007

Tribunal:

Santiago Velilla Cerdán Presidente/a
Rosa Elvira Lillo Rodríguez Secretaria
C. M. Cuadras Vocal
Richard Bourgon Vocal
Michael Greenacre Vocal

Tipo: Tesis

Teseo: 140929 DIALNET

Resumen

El análisis cluster es un antiguo problema revivido en las últimas décadas, En el trabajo presentado abordamos algunos problemas que aparecen en la práctica. Para entender los distintos resultados producidos por diferentes algoritmos es importante estudiar la relación entre clusters procedentes de análisis diferentes, por lo que presentamos un método de comparación para visualizar relaciones entre clusterings jerárquicos o no-jerárquicos, basado en grafos, utilizando un criterio de estética o de información mutua para cortar los dendrogramas en el caso jerárquico. Desarrollamos dos algoritmos de refinamiento del estado inicial de métodos de clustering iterativos, utilizando el concepto de profundidad y bootstrap. Esto además permite desarrollar un algoritmo de clustering no rígido, asignando a los puntos probabilidades de pertenencia a los clusters. Para determinar el número de grupos de un conjunto (habitualmente desconocido) hemos utilizado ideas del método de comparación y el concepto de profundidad, desarrollando tres técnicas de estimación. Hemos realizado un estudio extensivo para todos los métodos propuestos en datos simulados y en datos de expresión génica, y hemos probado que las técnicas desarrolladas en este trabajo son útiles y eficientes, tanto desde un punto de vista estadístico como biológico.