Estoy tratando de entender la salida de análisis de componentes principales se realiza de la siguiente manera:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
Tiendo a la conclusión siguiente de arriba de la salida:
La proporción de la varianza indica la cantidad de varianza total que hay en la varianza de un determinado componente principal. Por lo tanto, la PC1 variabilidad explica el 73% de la varianza total de los datos.
La rotación de los valores que se muestran son los mismos como 'cargas' mencionado en algunas descripciones.
Teniendo en cuenta las rotaciones de la PC1, se puede concluir que los Sépalos.La Longitud Del Pétalo.La longitud y el Pétalo.Ancho están directamente relacionadas, y todos ellos están inversamente relacionados con los Sépalos.Ancho (que tiene un valor negativo en la rotación de la PC1)
No puede ser un factor en las plantas (algunos químicas/físico funcional del sistema, etc) que pueden estar afectando a todas estas variables (Sépalo.La Longitud Del Pétalo.La longitud y el Pétalo.De ancho en una sola dirección y Sépalo.La anchura en la dirección opuesta).
Si quiero mostrar todas las rotaciones en un gráfico, que puede mostrar su contribución relativa a la variación total multiplicando cada rotación por la proporción de la varianza de la componente principal. Por ejemplo, para la PC1, las rotaciones de 0,52, -0.26, 0.58 y 0,56 son todos multiplicado por 0.73 (en proporción de varianza para la PC1, que se muestra en el resumen(res) de salida.
Yo estoy en lo correcto acerca de las conclusiones anteriores?
Edición con respecto a la pregunta 5: quiero mostrar a todo el giro en un simple barchart de la siguiente manera:
Desde la PC2, PC3 y PC4 han progresivamente menor contribución a la variación, va a tener sentido para ajustar (reducir) las saturaciones de las variables?