¿Por qué divergencia KL no se utiliza como una medida para comparar clusterings?

Question

¿Por qué divergencia KL no se utiliza como una medida para comparar clusterings?

Preguntado el 16 de Enero, 2018: Cuando se hizo la pregunta
126 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

En la literatura de la detección de la comunidad hay varias medidas bases en los principios de la teoría de la información (información mutua normalizado, variación de la información) que se utilizan para comparar las particiones. Me pregunto por qué divergencia KL no es popular para comparación mientras que compara dos distribuciones probabilísticas similares a los racimos.

Preguntado el 16 de Enero, 2018 por Karen Mkhitaryan

Answer 1

2 Respuestas

Answer 2

1voto

Amadiere Puntos 5606

Divergencia de KL asume que usted sabe que el racimo es que etiqueta. Pero ¿qué pasa si el número de grupos y clases no es lo mismo? Un buen agrupamiento puede necesitar para dividir una clase en dos partes, si los datos tienen una estructura. Además, KL es asimétrica.

NMI está estrechamente relacionado con, pero como compara cada cluster en cada etiqueta, no tienes el problema de los grupos de asignación a las clases.

Respondido el 17 de Enero, 2018 por Amadiere (5606 Puntos )

Answer 3

1voto

DJohnson Puntos 1347

El OP ha enunciado de su pregunta en términos de "popularidad". Esto puede no ser la manera correcta de pensar sobre el uso de la divergencia KL wrt de la agrupación. De hecho, KL métricas son utilizadas en la teoría de la información y la complejidad de clúster basado en algoritmos, pero la evaluación de la 'popularidad' de este tipo de rutinas sería difícil.

Permutación de distribución de la agrupación es uno de la rutina. PDC se describe en varios de los documentos. Aquí hay un enlace a la PDC R módulo que contiene una descripción de la utilización de la divergencia KL ... https://cran.r-project.org/web/packages/pdc/pdc.pdf

Luego hay Eamonn Keogh el SAXO y iSAX rutinas, que son similares a PDC, pero bien puede ser más "populares" ... http://www.cs.ucr.edu/~eamonn/SAX.htm

Respondido el 17 de Enero, 2018 por DJohnson (1347 Puntos )

¿Por qué divergencia KL no se utiliza como una medida para comparar clusterings?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Por qué divergencia KL no se utiliza como una medida para comparar clusterings?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: