6 votos

Algoritmo para elegir el número de clústeres cuando se usa pam en R?

Yo soy la agrupación de un conjunto de datos mediante el pam comando (desde {clúster} paquete), y deseo a decidir sobre el número de clústeres para usar.

Yo era capaz de implementar The_Elbow_Method en R (ver wiki) para hacer eso. Pero eso no me proporcionan con cualquier criterios sólidos (como AIC, por ejemplo) para la decisión.

Yo vine por el {clValid} paquete que se ve prometedor, pero quería saber si hay cualquier otro R soluciones (que sepa) para elegir el número de clústeres para pam?

He aquí algunas código ficticio si alguien quiere mostrar ejemplos:

data(iris)
head(iris)
require(cluster)
pam(iris[,1:4], 3)

13voto

reconbot Puntos 1670

Usted puede encontrar una respuesta a una pregunta similar útil. También he utilizado clValid pero, según recuerdo, era más bien lento (al menos relativamente grandes conjuntos de datos).

13voto

ESRogs Puntos 1381

¿Qué acerca de la silueta?

4voto

Omar Kooheji Puntos 384

El paquete de fpc proporciona un par de agrupación de las estadísticas. Si estás buscando información de criterios, en particular, la cluster.stats método proporciona una información de la distancia. Para la mezcla de los modelos basados en la agrupación, el BIC está disponible.

3voto

Eric Platon Puntos 1784

Me encontré con un paquete recientemente que se supone para ayudar con esto y a los que hacen referencia a usarlo con pam. Yo no lo he probado aún, pero parece prometedor. Retirar la viñeta.

http://cran.r-project.org/web/packages/clues/index.html

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X