En el caso de PCA, "varianza" significa varianza sumativa o variabilidad multivariante o variabilidad global o variabilidad total . A continuación se muestra la matriz de covarianza de unas 3 variables. Sus varianzas están en la diagonal, y la suma de los 3 valores (3,448) es la variabilidad global.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Ahora, el ACP sustituye las variables originales por nuevas variables, llamadas componentes principales, que son ortogonales (es decir, tienen covariación cero) y tienen varianzas (llamadas valores propios) en orden decreciente. Así, la matriz de covarianza entre los componentes principales extraídos de los datos anteriores es esta
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Obsérvese que la suma diagonal sigue siendo 3,448, lo que indica que los 3 componentes explican toda la variabilidad multivariante. El primer componente principal representa o "explica" 1,651/3,448 = 47,9% de la variabilidad global; el segundo explica 1,220/3,448 = 35,4% de la misma; el tercero explica 0,577/3,448 = 16,7% de la misma.
Entonces, ¿qué quieren decir cuando afirman que " El PCA maximiza la varianza " o " El PCA explica la máxima varianza "? Esto no es, por supuesto, que encuentre la mayor varianza entre tres valores 1.343730519 .619205620 1.485549631
, no. PCA encuentra, en el espacio de datos, el dimensión (dirección) con la mayor varianza del conjunto desviación 1.343730519+.619205620+1.485549631 = 3.448
. Esa mayor variación sería 1.651354285
. A continuación, encuentra la dimensión de la segunda mayor varianza, ortogonal a la primera, de entre las restantes 3.448-1.651354285
la varianza global. Esa 2ª dimensión sería 1.220288343
de la varianza. Y así sucesivamente. La última dimensión que queda es .576843142
de la variante. Ver también "Pt3" aquí y el gran responder aquí explicando cómo se hace con más detalle.
Matemáticamente, el PCA se realiza a través de funciones de álgebra lineal llamadas eigen-descomposición o svd-descomposición. Estas funciones le devolverán todos los valores propios 1.651354285 1.220288343 .576843142
(y los correspondientes vectores propios) a la vez ( véase , véase ).
0 votos
Ver también preguntas/etiquetado/regresión+tamaño del efecto -> Abelson, La paradoja de la explicación de la varianza , 1985, 5p.