Como por las respuestas a esta pregunta, hay deficiencias en la heurística de decidir sobre el número de clusters.
Una actuación más eficaz podría ser la probabilidad basado en la agrupación: desde una perspectiva probabilística, el objetivo de la agrupación es encontrar la más probable conjunto de los clústeres de la vista de los datos. Por lo tanto, nunca podemos estar "100% seguro" de que la formación de instancias debe ser colocado en algunos de racimo: ellos sólo tienen una cierta probabilidad de pertenecer a él.
Me pregunto, ¿si este razonamiento es correcto, y cómo funcionaría en la práctica.