2 votos

¿Es válido hacer clustering de K-means en datos reducidos por PCA?

Aquí es el tutorial básico de SKLearn sobre K-means.

Ejecutan el PCA y luego hacen K-means en los datos reducidos. ¿Puede afectar radicalmente al resultado? ¿Obtendremos clusters totalmente diferentes si aplicamos PCA sobre datos ya agrupados?

2voto

Amadiere Puntos 5606

Sí, puede afectar radicalmente al resultado.

Se pueden obtener clusters completamente ortogonales si las varianzas de los componentes son diferentes por un factor grande.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X