Este es un gráfico de mis datos
Estos son los valores:
xvalues yvalues
1 1.091186
2 2.653722
3 3.309146
4 5.206479
5 5.115582
6 8.537005
7 10.013147
8 9.802291
9 10.667769
10 5.809750
11 9.624475
12 11.806013
13 13.587066
14 14.146781
15 13.707472
16 12.891355
17 19.435301
18 16.122108
19 17.768536
20 23.813027
21 21.819081
22 23.556074
23 21.170983
24 27.621148
25 22.932580
26 20.704689
27 25.530339
28 26.227371
29 26.051016
30 31.047145
Ahora hago un PCA y un biplot de él:
Según Jeromy Anglim in: Interpretación de biplots en el análisis de componentes principales en R
Los ejes izquierdo e inferior muestran las cargas; los ejes superior y derecho muestran las puntuaciones de los componentes principales.Los ejes izquierdo e inferior muestran las puntuaciones de los componentes principales [normalizados]; los ejes superior y derecho muestran las cargas.
Quiero estar seguro de que realmente entiendo esto.
Empecemos con las cargas: éstas pueden ser visualizadas en R por escrito:
results <- prcomp(your_data)
results$rotation
PC1 PC2
xvalues 0.7235616 -0.6902599
yvalues 0.6902599 0.7235616
summary(results)
Importance of components:
PC1 PC2
Standard deviation 12.0747 1.56606
Proportion of Variance 0.9835 0.01654
Cumulative Proportion 0.9835 1.00000
Ahora veamos la flecha roja de los valores X. Su punta está alrededor de 0,25 en el eje x de las cargas. Pero de acuerdo con las cargas que acabo de escribir, debería estar alrededor de 0,72. ¿Qué me estoy perdiendo?
Finalmente, veamos el punto 1. Según los ejes, eso me dice la puntuación del componente principal. ¿Es esa la coordenada en el nuevo marco de referencia? No tiene sentido para mí porque creo que el nuevo origen de los ejes está alrededor del punto (15,15) en la Parcela 3. Si miro eso (y supongo que estoy completamente equivocado aquí), el punto uno debería tener una coordenada alrededor de -20 o así, y no 40. ¿Dónde está mi error?
Actualización
Traté de planear esto:
plot(pca_results$x)
Aquí se puede ver que el primer punto tiene la coordenada que pensé que debía tener. Pero, aún así, ¿cuáles son las unidades en el biplot entonces?
0 votos
Tu último párrafo es un poco místico porque parece que no se corresponde con tus imágenes. El biplot PCA se puede interpretar como el superponer gráfico de dispersión una superposición de dos gráficos de dispersión en los mismos ejes (los PC): gráfico de las puntuaciones de los datos y gráfico de las cargas de las variables. También puede echar un vistazo a aquí .
2 votos
En su primer biplot, la nube de datos es redonda a pesar de que, según sus datos, la PC1 debe ser mucho más fuerte que la PC2. Esto me hace pensar que las puntuaciones de PC en el biplot están estandarizadas (a st. dev. 1). Compruebe si esto es cierto. Los puntos de carga (flechas rojas) son probablemente cargas, como deberían. El
results$rotation
las cifras que presenta son claramente las valores del vector propio , no el cargas . Tenga en cuenta que elR
El paquete PCA que utilizas utiliza mal la palabra "cargas", llamando incorrectamente "cargas" a los vectores propios.0 votos
¿Cómo compruebo entonces las cargas?
0 votos
Por definición, la "matriz de cargas" (antes de la rotación o después de la rotación ortogonal) debe tener una suma de cuadrados de columna igual a las varianzas de los factores/componentes correspondientes. Así, en el ACP, las cargas después de la extracción y la rotación previa son los vectores propios multiplicados por la raíz cuadrada de sus correspondientes valores propios (porque el valor propio es la varianza del componente, antes de la rotación).
0 votos
No sé cuál es su
results$rotation
matriz es en realidad. Podría ser vectores propios (rotación previa) o podría ser la matriz de rotación ortogonal. Como no has mostrado los datos originales (los valores) y el resultado completo de tu PCA, no puedo decirlo.0 votos
Voy a actualizar el post con toda la información que puedas necesitar