He leído a través de esta explicación aquí con respecto al cálculo de la varianza explicada a partir del resultado del PCA. Creo que lo he hecho bien, pero puede que esté equivocado en mi interpretación de la salida de R.
En el siguiente ejemplo, me gustaría calcular el porcentaje de varianza explicado por el primer componente principal del conjunto de datos USArrests.
pca <- prcomp(USArrests, scale = TRUE)
eigs <- pca$sdev^2
eigs[1] / sum(eigs)
[1] 0.6200604
He supuesto que R utiliza sdev
como la raíz cuadrada de los valores propios. Así que lo elevo al cuadrado y divido el primer valor por el total. ¿Es esto correcto?