Hace que las magnitudes de los principales vectores propios obtenidos por la PCA tiene nada que ver con las correlaciones de las variables originales, y podemos usar el PCA para la agrupación? Gracias!
Respuesta
¿Demasiados anuncios?@ q2: Si el uso de todos los componentes principales, entonces esta es sólo una rotación en el espacio multidimensional y la distancia euclídea(!) las distancias entre los puntos de datos no se ven afectados.
Sin embargo, por ejemplo en taxi-las distancias son afectados por la rotación. (Esta ca se ve si se considera la unidad de la plaza y el rol de la distancia entre los dos extremos de la diagonal. Sin rotar tiene dos veces una frontera s la distancia es de 2, pero si se gira 45 grados tiene la distancia sqrt(2))
Además, una vez que se emplean PCA, a continuación, su objetivo es reducir la dimensionalidad, así suele descartar varianza/covarianza (de acuerdo a la omisión de menos de componentes principales), y esto no se refleja en la selección de conjuntos de elementos en una "lata" clúster análisis, por lo que las soluciones deben ser diferentes.
[opinión] Bien, que el PCA y el rotar racimos generalmente no son perfectamente iguales no significa, que el PCA basado en clusters son peores/malo/sin sentido [/opinión]