Mi actual del conjunto de datos tiene tres condiciones, y hemos medido los niveles de actividad de 10.000 genes en cada condición. Replicado 8 veces.
El uso de 10,000 modelos lineales, se determina para cada par de condiciones (es decir, para cada uno de los tres contrastes) el número de genes con significativamente diferentes niveles de actividad. Este es el procedimiento estándar para este tipo de datos de microarrays.
Podemos encontrar:
- 2000 genes significativamente diferentes niveles de actividad entre la a y la B
- 1500 genes significativamente diferentes niveles de actividad entre la a y la C
- 100 genes significativamente diferentes niveles de actividad entre B y C
Esto sugiere que las condiciones B y C son más similares entre sí que a la C. PCA sugiere el mismo resultado. Es allí cualquier manera de cuantificar la medida en que "las condiciones B y C son más similares entre sí que a C (es decir, para poner un p-valor?)
Gracias por su ayuda y pido disculpas si esta pregunta es trivial.
Saludos cordiales,