X1 y X2 son "redundantes" en el sentido de duplicados lineales entre sí si se correlacionan perfectamente ( $r=1$ ). Entonces los dos vectores variables deben coincidir sean colineales en el espacio (ese espacio -donde las variables se dibujan como vectores, flechas- se llama " espacio temático ").
Pero a partir del gráfico, sin conocer las correlaciones de las variables, se no se puede decir si los vectores coinciden en el espacio - porque el gráfico es sólo bidimensional mientras que el espacio que abarcan las cuatro variables es potencialmente cuatridimensional (o tridimensional, en el caso de X1 y X2 coinciden). El plano de la parcela definido por las dos primeras PC es el subespacio dentro de ese espacio de 4 (o 3) dimensiones. Pues lo que vemos como flechas en el plano no son más que las proyecciones de los verdaderos vectores variables sobre él, sombras proyectadas sobre el mismo por ellos. Lo que digo se expresa más gráficamente y con fórmulas aquí . Así, teniendo sólo su parcela, la cuestión de si X1 y X2 coincidir o no está aún abierto.
Pero, supongamos un caso en el que los dos PCs explicar La parte del león de la variabilidad (digamos, el 80% o más de la varianza global). Eso significará que las dimensiones subsiguientes (definidas por PC3 y PC4) son poco profundas, por lo que el espacio no está lejos de ser sólo el plano que mostró. Entonces el ángulo entre X1 y X2 (cuyo coseno es su correlación) no podrá ser amplia. Pero esto es para decir que las dos variables son no muy lejos de ser colineal de todos modos. Si es así (es decir, si queda poca varianza sin absorber por PC1+PC2), usted puede respecto a X1 y X2 como razonablemente redundante.
Por último, si coinciden o están cerca de coincidir y por lo tanto son redundantes para usted, could I stop measuring the values for x2 if I already measure x1 values?
- preguntas. Eso depende de lo que vaya a hacer después de la eliminación de una de las dos variables. Si, por ejemplo, se elimina el uno y va a rehacer PCA - los PC cambiará a pesar de que ha eliminado una medida "redundante".
0 votos
Creo que es una pregunta duplicada, puede comprobar esto Correo electrónico:
1 votos
En esta pregunta se plantea una cuestión específica sobre la redundancia variable. No creo que sea un duplicado.
0 votos
stats.stackexchange.com/q/224204/3277 es teóricamente una cuestión similar (ver).