5 votos

Interpretar las flechas superpuestas en un biplot de PCA: ¿significa que las variables son redundantes?

Soy nuevo en el análisis de componentes principales (PCA) y no entiendo realmente la representación biplot de sus resultados, así que realmente apreciaría alguna orientación. Teniendo el ejemplo de la ilustración que se muestra a continuación. ¿Podría decir que las variables x1 y x2 me están diciendo el mismo y por lo tanto no hay necesidad de registrar los valores de uno de los dos?

En mi caso las variables son desviaciones geométricas de una parte donde los puntos medidos están cerca unos de otros. Por lo tanto, me gustaría saber si basado en el biplot de PCA podría dejar de medir los valores para x2 si ya he medido x1 valores.

enter image description here

0 votos

Creo que es una pregunta duplicada, puede comprobar esto Correo electrónico:

1 votos

En esta pregunta se plantea una cuestión específica sobre la redundancia variable. No creo que sea un duplicado.

0 votos

stats.stackexchange.com/q/224204/3277 es teóricamente una cuestión similar (ver).

5voto

Uri Puntos 111

X1 y X2 son "redundantes" en el sentido de duplicados lineales entre sí si se correlacionan perfectamente ( $r=1$ ). Entonces los dos vectores variables deben coincidir sean colineales en el espacio (ese espacio -donde las variables se dibujan como vectores, flechas- se llama " espacio temático ").

Pero a partir del gráfico, sin conocer las correlaciones de las variables, se no se puede decir si los vectores coinciden en el espacio - porque el gráfico es sólo bidimensional mientras que el espacio que abarcan las cuatro variables es potencialmente cuatridimensional (o tridimensional, en el caso de X1 y X2 coinciden). El plano de la parcela definido por las dos primeras PC es el subespacio dentro de ese espacio de 4 (o 3) dimensiones. Pues lo que vemos como flechas en el plano no son más que las proyecciones de los verdaderos vectores variables sobre él, sombras proyectadas sobre el mismo por ellos. Lo que digo se expresa más gráficamente y con fórmulas aquí . Así, teniendo sólo su parcela, la cuestión de si X1 y X2 coincidir o no está aún abierto.

Pero, supongamos un caso en el que los dos PCs explicar La parte del león de la variabilidad (digamos, el 80% o más de la varianza global). Eso significará que las dimensiones subsiguientes (definidas por PC3 y PC4) son poco profundas, por lo que el espacio no está lejos de ser sólo el plano que mostró. Entonces el ángulo entre X1 y X2 (cuyo coseno es su correlación) no podrá ser amplia. Pero esto es para decir que las dos variables son no muy lejos de ser colineal de todos modos. Si es así (es decir, si queda poca varianza sin absorber por PC1+PC2), usted puede respecto a X1 y X2 como razonablemente redundante.

Por último, si coinciden o están cerca de coincidir y por lo tanto son redundantes para usted, could I stop measuring the values for x2 if I already measure x1 values? - preguntas. Eso depende de lo que vaya a hacer después de la eliminación de una de las dos variables. Si, por ejemplo, se elimina el uno y va a rehacer PCA - los PC cambiará a pesar de que ha eliminado una medida "redundante".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X