Actualmente estoy en un internado para R bioinformática, donde estoy escribiendo software de una sola célula de la secuencia de ARN análisis. Estamos buscando los genes expresados diferencialmente entre los grupos, pero no entiendo el proceso actual sobre exactamente cómo hacerlo.
Ahora, tengo mis datos actuales: tengo más de 20.000 muestras a través de unos 850 genes, y no tengo ningún pre-determinado o adjunto de agrupación de datos para ir junto con él.
No entiendo exactamente cómo comenzar el análisis o lo que el proceso podría parecer. Tengo algunos paquetes útiles como DESeq2
y NMF
a ayudarme, pero estoy teniendo un tiempo difícil la comprensión de la relación entre el análisis diferencial y la agrupación jerárquica.
Por lo que entiendo, el análisis diferencial se centra en encontrar las diferencias entre los grupos... sin Embargo, los datos de mi carece de toda agrupación de la información; me han dicho que el uso de NMF, pero que me causa problemas con el uso de la memoria y tal, y yo no entender exactamente cómo funciona...
La agrupación jerárquica de los sonidos similares a los del análisis diferencial en términos de cómo se categoriza cosas, pero me dijeron que no era muy robusta y fiable.
Me siento como tengo que preguntarle una cuestión más profunda, pero no sé mucho acerca de las estadísticas, período. Yo sólo soy un simple estudiantes de primer año/segundo año en la universidad, y estoy despistado. Puede alguien darme una mano?