Uno de los mayores problemas del análisis de conglomerados es que podemos llegar a una conclusión diferente cuando nos basamos en diferentes métodos de agrupación utilizados (incluidos los diferentes métodos de vinculación en la agrupación jerárquica).
Me gustaría saber su opinión al respecto - qué método seleccionará y cómo. Se podría decir que "el mejor método de agrupación es el que da la respuesta correcta"; pero puedo cuestionar en respuesta que el análisis de conglomerados se supone que es un sin supervisión técnica - entonces, ¿cómo puedo saber qué método o vinculación es la respuesta correcta?
En general: ¿es un clustering por sí solo lo suficientemente robusto como para confiar en él? ¿O necesitamos un segundo método y obtener un resultado compartido que se base en ambos?
Mi pregunta no sólo se refiere a las posibles formas de validar / evaluar rendimiento de la agrupación, pero es más amplio - en qué nos basamos para seleccionar/preferir un método/algoritmo de clustering sobre otro. Además, ¿existe un advertencias que debemos buscar cuando seleccionamos un método para agrupar nuestros datos?
Sé que es una pregunta muy general y muy difícil de responder. Sólo me gustaría saber si tienen algún comentario o algún consejo o alguna sugerencia para que pueda aprender más sobre esto.
0 votos
Compruebe también este una pregunta similar.
0 votos
Y este uno.
2 votos
Algunos enlaces específicos sobre la validación interna y externa: este . Y este . Y que . Y que . Y que . Y este . Y yonder . Y busca más.