111 votos

Cargas vs vectores propios en PCA: cuándo usar uno u otro?

En el análisis de componentes principales (PCA), obtenemos los vectores propios (vectores unitarios) y valores propios. Ahora, vamos a definir las cargas como $$\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}.$$

Sé que los vectores propios son sólo las direcciones y cargas (como se define más arriba) también incluyen la varianza a lo largo de estas instrucciones. Pero para mi la mejor comprensión, me gustaría saber donde debo utilizar cargas en lugar de vectores propios? Un ejemplo sería perfecto!

Tengo generalmente sólo se ve la gente el uso de vectores propios pero de vez en cuando se utilizan cargas (como se define más arriba) y, a continuación, me quedo la sensación de que realmente no entiendo la diferencia.

111voto

Uri Puntos 111

En el PCA, se puede dividir la covarianza (o correlación) de la matriz en la escala de la parte (autovalores) y la dirección de la parte (vectores propios). A continuación, puede dotar a los vectores propios con la escala: las cargas. Así, las cargas son así a ser comparable por su magnitud con el covarianzas/las correlaciones observadas entre las variables, - porque lo que había sido extraídas de las variables de covariación ahora returnes atrás - en la forma de la covariación entre las variables y los componentes. En realidad, los cargamentos son las covarianzas/las correlaciones entre las variables originales y la unidad de la escala de componentes.

Cargas:

  1. La interpretación de componentes principales o factores; Porque ellos son la combinación lineal de los pesos (coeficientes) por el cual la unidad de escala de los componentes o factores que determinan o "carga" de una variable.
  2. Los cargamentos, que a veces se "enciende" (por ejemplo, varimax) posteriormente, para facilitar interpretabilidad (ver también);
  3. Es cargamentos que "restaurar" el original de la covarianza/matriz de correlación (ver también este hilo discutir los matices de la PCA y de FA en ese respecto);
  4. Mientras que en el PCA puede calcular los valores de las componentes de los vectores propios y cargas, en el análisis de los factores de calcular el factor de las puntuaciones de los cargamentos.
  5. Y, sobre todo, la carga de la matriz es de carácter informativo: vertical sumas de los cuadrados son los valores propios, de los componentes de varianzas y su horizontal de las sumas de cuadrados son partes de las variables de las desviaciones ser "explicado" por los componentes.

Un ejemplo de cálculos de hecho en el PCA y FA para que usted vea.

Los vectores propios son la unidad de escala de cargas; y son los coeficientes (los cosenos) de transformación ortogonal (rotación) de las variables en los componentes principales o en la espalda. Por lo tanto, es fácil calcular los componentes de los valores (no estandarizado) con ellos. Además de que su uso es limitado.

Aunque los vectores propios y los cargamentos son simplemente dos maneras diferentes para normalizar las coordenadas de los mismos puntos que representan las columnas (variables) de los datos en un diagrama de dispersión biespacial, no es una buena idea mezclar los dos términos. Esta respuesta se explica por qué. Véase también.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X