id sam1 sam2 sam3 sam4
gene1 33 23 88 98
gene2 0 0 99 95
gene3 77 100 44 65
gene4 0 0 0 0
gene5 100 100 100 100
:
:
gene20000 58 33 78 56
Tengo 20K genes (filas) y cuatro muestras (columnas) que se da en porcentaje. Cada gen es común a cuatro muestras. La hipótesis es que si un gen está presente en el 100% de una muestra, se dice que está presente en esa muestra, y si está ausente en el 0%. (Por ejemplo, el gen3 está presente en la muestra2 (sam2) y el gen4 está ausente en todas las muestras).
Como tengo 20K genes, me gustaría hacer la técnica de clustering. ¿Puedo hacer biclustering y producir un mapa de calor? Si es así, por favor, hágamelo saber cómo hacerlo en R?