27 votos

Estimación de las características más importantes en una partición de clúster de k-means

¿Hay alguna manera de determinar qué características / variables del conjunto de datos son las más importantes / dominantes dentro de una solución de clúster de k-medias?

-1voto

Craig Putnam Puntos 183

He aquí un método muy sencillo. Tenga en cuenta que la distancia euclidiana entre dos centros de conglomerados es una suma de diferencias cuadradas entre características individuales. Luego, podemos usar la diferencia cuadrada como el peso de cada característica.

Distancia euclidiana

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X