Soy nuevo en PCA y estoy tratando de interpretar algunos resultados que tengo con respecto a algunos datos biológicos y tengo algunas dificultades para entenderlos completamente. Básicamente, estos datos están compuestos por soluciones (conjunto de 1,2,3,etc... reacciones biológicas) que corresponden a columnas (reacciones) que contienen flujos (Valores). Es algo así :
Reaction A Reaction B Reaction C
sol_1 10 20 30
sol_2 5 3 2
sol_3 10 40 40
Como tengo muchas soluciones y me gustaría seguir analizando sólo 2 o 3, mi objetivo es hacer un PCA (junto con algún HCA) para encontrar patrones y agrupar soluciones para reducir el número de mi grupo de soluciones.
En un modelo que he hecho, tengo estos resultados:
Mis principales preguntas son:
- ¿Qué se puede interpretar respecto a una varianza explicada tan alta en una sola dimensión (en comparación con los resultados que tengo anteriormente)?
- En cuanto al gráfico de puntuación (gráfico de individuos), ¿qué tipo de interpretación se puede hacer de esa visualización? porque parece que hay 4 grupos principales y que tienen simetría entre sí.
Cualquier duda que tengáis o más información que pueda detallar no dudéis en preguntar. Y cualquier idea será útil . Gracias.