¿Cuáles son los enfoques probabilistas para encontrar el número de clusters?

Question

¿Cuáles son los enfoques probabilistas para encontrar el número de clusters?

Preguntado el 17 de Febrero, 2012: Cuando se hizo la pregunta
151 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Como por las respuestas a esta pregunta, hay deficiencias en la heurística de decidir sobre el número de clusters.

Una actuación más eficaz podría ser la probabilidad basado en la agrupación: desde una perspectiva probabilística, el objetivo de la agrupación es encontrar la más probable conjunto de los clústeres de la vista de los datos. Por lo tanto, nunca podemos estar "100% seguro" de que la formación de instancias debe ser colocado en algunos de racimo: ellos sólo tienen una cierta probabilidad de pertenecer a él.

Me pregunto, ¿si este razonamiento es correcto, y cómo funcionaría en la práctica.

Preguntado el 17 de Febrero, 2012 por vignesh

Answer 1

2 Respuestas

Answer 2

8voto

davidsheldon Puntos 211

Hay métodos para hacerlo. Un buen punto de partida es

Rasmussen, C. E. (2000). El Infinito Modelo De Mezcla De Gaussianas. En S. A. Solla, T. K. Leen, & K.-R. Müller (Eds.), Los avances en el Procesamiento de Información Neuronal Sistemas de 12 (Vol. 12, pp 554-560). MIT Press.

La idea es poner un Dirichlet antes en la mezcla de la masa de la mezcla de Gaussianas y tomar el límite de una infinidad de componentes. Desde siempre se han de tener un número finito de puntos de datos, no importa que potencialmente tienen infinidad de mezclas, pero permite que el modelo a elegir nuevas agrupaciones si es necesario.

Hay mucho más que trabajar en eso. Un buen punto de partida sería la publicaciones de Yee Whye Teh.

Respondido el 17 de Febrero, 2012 por davidsheldon (211 Puntos )

Answer 3

0voto

Amadiere Puntos 5606

La primera pregunta que usted debe entonces la respuesta es:

¿Qué es un clúster?

La mayoría de las veces, un clúster es lo que el algoritmo de clústeres de encuentra. Que, por definición, entonces es correcto.

Si ejecuta por ejemplo, k-means, se hace un buen trabajo en la búsqueda de la óptima $k$ celda de voronoi de partición del conjunto de datos. Así que si usted se refiere a k-means, la pregunta es: ¿cuáles son las posibilidades de que el conjunto de datos se basa en el $k$ Voronoi células?

Respondido el 23 de Febrero, 2012 por Amadiere (5606 Puntos )

¿Cuáles son los enfoques probabilistas para encontrar el número de clusters?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuáles son los enfoques probabilistas para encontrar el número de clusters?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: