6 votos

¿Cuáles son los enfoques probabilistas para encontrar el número de clusters?

Como por las respuestas a esta pregunta, hay deficiencias en la heurística de decidir sobre el número de clusters.

Una actuación más eficaz podría ser la probabilidad basado en la agrupación: desde una perspectiva probabilística, el objetivo de la agrupación es encontrar la más probable conjunto de los clústeres de la vista de los datos. Por lo tanto, nunca podemos estar "100% seguro" de que la formación de instancias debe ser colocado en algunos de racimo: ellos sólo tienen una cierta probabilidad de pertenecer a él.

Me pregunto, ¿si este razonamiento es correcto, y cómo funcionaría en la práctica.

8voto

davidsheldon Puntos 211

Hay métodos para hacerlo. Un buen punto de partida es

Rasmussen, C. E. (2000). El Infinito Modelo De Mezcla De Gaussianas. En S. A. Solla, T. K. Leen, & K.-R. Müller (Eds.), Los avances en el Procesamiento de Información Neuronal Sistemas de 12 (Vol. 12, pp 554-560). MIT Press.

La idea es poner un Dirichlet antes en la mezcla de la masa de la mezcla de Gaussianas y tomar el límite de una infinidad de componentes. Desde siempre se han de tener un número finito de puntos de datos, no importa que potencialmente tienen infinidad de mezclas, pero permite que el modelo a elegir nuevas agrupaciones si es necesario.

Hay mucho más que trabajar en eso. Un buen punto de partida sería la publicaciones de Yee Whye Teh.

0voto

Amadiere Puntos 5606

La primera pregunta que usted debe entonces la respuesta es:

¿Qué es un clúster?

La mayoría de las veces, un clúster es lo que el algoritmo de clústeres de encuentra. Que, por definición, entonces es correcto.

Si ejecuta por ejemplo, k-means, se hace un buen trabajo en la búsqueda de la óptima $k$ celda de voronoi de partición del conjunto de datos. Así que si usted se refiere a k-means, la pregunta es: ¿cuáles son las posibilidades de que el conjunto de datos se basa en el $k$ Voronoi células?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X