Métodos de clustering en datos de expresión génica

  1. Torrente Orihuela, Ester Aurora
Supervised by:
  1. Alvis Brazma Director
  2. Juan José Romo Urroz Director

Defence university: Universidad Carlos III de Madrid

Fecha de defensa: 22 June 2007

Committee:
  1. Santiago Velilla Cerdán Chair
  2. Rosa Elvira Lillo Rodríguez Secretary
  3. C. M. Cuadras Committee member
  4. Richard Bourgon Committee member
  5. Michael Greenacre Committee member

Type: Thesis

Teseo: 140929 DIALNET

Abstract

El análisis cluster es un antiguo problema revivido en las últimas décadas, En el trabajo presentado abordamos algunos problemas que aparecen en la práctica. Para entender los distintos resultados producidos por diferentes algoritmos es importante estudiar la relación entre clusters procedentes de análisis diferentes, por lo que presentamos un método de comparación para visualizar relaciones entre clusterings jerárquicos o no-jerárquicos, basado en grafos, utilizando un criterio de estética o de información mutua para cortar los dendrogramas en el caso jerárquico. Desarrollamos dos algoritmos de refinamiento del estado inicial de métodos de clustering iterativos, utilizando el concepto de profundidad y bootstrap. Esto además permite desarrollar un algoritmo de clustering no rígido, asignando a los puntos probabilidades de pertenencia a los clusters. Para determinar el número de grupos de un conjunto (habitualmente desconocido) hemos utilizado ideas del método de comparación y el concepto de profundidad, desarrollando tres técnicas de estimación. Hemos realizado un estudio extensivo para todos los métodos propuestos en datos simulados y en datos de expresión génica, y hemos probado que las técnicas desarrolladas en este trabajo son útiles y eficientes, tanto desde un punto de vista estadístico como biológico.