Tengo una matriz de números reales positivos entre 0 y 1, las filas representan los genes y las columnas representan las muestras. Número de filas es mayor que el número de columnas de una magnitud de $10^4$. Me pregunto cómo visualizar esto en R
. Sé mapa de calor es una de las maneras de hacer esto, pero hay otras ideas. Aquí hay algunos puntos que quiero destacar en la visualización:
Datos:
- Las filas y las columnas no tienen para ellos (como puede que ya se han dado cuenta); específicamente de las filas y las columnas son intercambiables.
- Las entradas de la matriz son números reales positivos entre 0 y 1.
- Una pequeña fracción de los datos (10% de las filas o de los genes, alrededor de 1000) son realmente "interesante".
- La matriz representa la probabilidad estimada de los genes que ser más activo en una muestra.
Objetivo:
- Quiero mostrar: que los genes son más activos y en los que muestra. La matriz tiene un montón de filas en las que las probabilidades son muy similares a través de las columnas.
- Estoy bien con el pedido de las filas (los genes) para hacer que el patrón más claro.
Mis pensamientos:
En el momento en el que puede determinar los genes activos en una muestra mediante la elección de un corte de decir $\ge 95\%$) y organizar los genes de tal manera que el primer conjunto de filas son los genes activos en el ejemplo 1, el segundo conjunto de filas son los genes activos en el ejemplo 2, ...
Yo también estaba pensando acerca de la visualización de un subconjunto de los datos, puede ser por muestreo filas. Pero yo no tuve ningún éxito.
Sé que estas ideas pueden no ser muy elegante, pero reorganiza mis datos en una forma que hace que el patrón más reconocible.
Sé que preguntas similares se han preguntado antes, pero pensé que mi consulta era un poco más específico, por lo que espero que pueda conseguir mejores aportaciones de los miembros de este foro.