7 votos

Dos vías de la agrupación en clústeres en R

Me pregunto cómo implementar de dos vías de la agrupación, como se explica en Statistica documentación en R. Cualquier ayuda en este sentido será muy apreciada. Gracias

9voto

DavLink Puntos 101

En general, usted debe encontrar siempre útiles consejos mirando a la CRAN Vistas de Tareas, en este caso el que se ocupa de Clúster de paquetes, o tal vez Rápido-R.

No me queda claro si el enlace que dio hace referencia estándar de técnicas de clustering para $n$ (individuos) por $k$ (variables) de la matriz de las medidas que se imponen limitaciones en el mapa de calor muestra, o dos modos de agrupamiento o de biclustering.

En el primer enfoque, podríamos, por ejemplo,

  1. calcular una medida de la (dis), la similitud entre los individuos, o correlación entre variables, y mostrar el resultado $n\times n$ o $k\times k$ matriz donde las filas y columnas se reorganizan por algún tipo de particiones o el pedido de técnica -- esta ayuda destacando los posibles subestructuras en la asociación de la matriz, y encontrarás más información en esta cuestión;
  2. calcular la correlación entre dos bloques de datos que se observan en los mismos individuos, y reordenar el patrón de correlaciones siguientes externo de coordinación técnica (por ejemplo, la agrupación jerárquica) -- que asciende a mostrar un mapa de calor de la observó estadísticas reordenar filas y columnas.

Como se propone en una respuesta anterior, el último es fácilmente disponible en la cim() función de la mixOmics paquete. De la ayuda en línea, podemos terminar con algo como esto:

enter image description here

Por favor, tenga en cuenta que esto es sólo un proceso de dos pasos convenientemente para visualizar el resumen de las medidas de asociación: agrupación de filas (individuos o variables) y columnas (individuos o variables) que se hace por separado.

En el segundo enfoque (biclustering), que me siento inclinado a favor, sólo conozco un paquete de R, biclust, que es una gran fuente de inspiración para la investigación en bioinformática. Algunos punteros también se han dado en un anterior hilo. (Pero incluso hay algunos papeles en la psicometría de la literatura.) En este caso, tenemos que poner algunas restricciones durante los clústeres porque queremos clúster de ambos individuos y variables al mismo tiempo.

De nuevo, puede mostrar la estructura resultante como mapas de calor (ver help(heatmapBC)), como se muestra a continuación

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X