Tengo una situación en la que necesito clasificar los artículos en grupos (digamos 6). Cuando ejecuté k-means el 90% de mis datos caen en 1 grupo el 10% restante caen en otros grupos. ¿Cuál es el siguiente paso? Para agrupar aún más los datos, he tomado el grupo de datos del 90% y, una vez más, he ejecutado k-means. Pero ahora de nuevo el 76% cayó en un grupo quedando en 14 grupos? ¿Cómo se puede hacer frente a esta situación?
Respuesta
¿Demasiados anuncios?Hay muchas opciones con el análisis de conglomerados. Puede elegir diferentes medidas de distancia y vinculación. Puede utilizar clusters jerárquicos en lugar de k-means. Incluso hay clusters difusos. Tiene la posibilidad de R
así que supongo que lo estás usando.
En esta página hay una gran lista de funciones de agrupación en R
. Cada uno tendrá muchas opciones. ¿Cuál has probado?
Dentro del tipo de idea k significa, por ejemplo, en pam
puede alterar la métrica de la distancia (usar Manhattan en lugar de Euclidean) El paquete 'flexclust` ofrece muchas opciones.