4 votos

¿Cuál es la relación entre el análisis diferencial y jerárquico de agrupamiento?

Actualmente estoy en un internado para R bioinformática, donde estoy escribiendo software de una sola célula de la secuencia de ARN análisis. Estamos buscando los genes expresados diferencialmente entre los grupos, pero no entiendo el proceso actual sobre exactamente cómo hacerlo.

Ahora, tengo mis datos actuales: tengo más de 20.000 muestras a través de unos 850 genes, y no tengo ningún pre-determinado o adjunto de agrupación de datos para ir junto con él.

No entiendo exactamente cómo comenzar el análisis o lo que el proceso podría parecer. Tengo algunos paquetes útiles como DESeq2 y NMF a ayudarme, pero estoy teniendo un tiempo difícil la comprensión de la relación entre el análisis diferencial y la agrupación jerárquica.

Por lo que entiendo, el análisis diferencial se centra en encontrar las diferencias entre los grupos... sin Embargo, los datos de mi carece de toda agrupación de la información; me han dicho que el uso de NMF, pero que me causa problemas con el uso de la memoria y tal, y yo no entender exactamente cómo funciona...

La agrupación jerárquica de los sonidos similares a los del análisis diferencial en términos de cómo se categoriza cosas, pero me dijeron que no era muy robusta y fiable.

Me siento como tengo que preguntarle una cuestión más profunda, pero no sé mucho acerca de las estadísticas, período. Yo sólo soy un simple estudiantes de primer año/segundo año en la universidad, y estoy despistado. Puede alguien darme una mano?

2voto

user81079 Puntos 1

Mi comprensión de la no-negativo de la factorización de la matriz (NMF, siempre deletrear sus siglas) es la que produce los grupos para usted. Al aproximarse a una matriz V por W veces H, la H de la matriz contiene información acerca de los clústeres de cada una de las columnas de V contribuye a la. Desde la página de Wikipedia para NMF: "Si H_kj > 0, lo que indica que los datos de entrada v_j pertenece/asignado al k-ésimo grupo". También mencionan que NMF es aproximadamente equivalente no a la agrupación jerárquica, pero a la K-means clustering (https://en.wikipedia.org/wiki/K-means_clustering). La clave para la agrupación jerárquica es el de la jerarquía: elementos pertenecen a grupos que pertenecen a grupos más grandes, y así sucesivamente. Aquí, usted sólo desea dividir el conjunto de datos en un número manejable de grupos de mirar. NMF es sólo una forma de agrupar los datos.

Sin saber más acerca de su biología de trabajo, le sugerimos lo siguiente. Si usted puede tomar una memoria manejable conjunto de datos, utilice sólo que, tal vez de 1.000 muestras en 10 genes-para acostumbrarse a las técnicas. Realizar NMF, leer sobre lo que significa y, a continuación, sumergirse en su completo conjunto de datos. Alguien de por aquí debe ser capaz de señalar a los grandes datos de los algoritmos para la NMF, pero yo no soy la persona adecuada para que...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X