Considere el siguiente ejemplo de R:
plot( hclust(dist(USArrests), "ave") )
-
¿Qué significa exactamente el eje "Altura"?
-
Mirando a Carolina del Norte y California (más bien a la izquierda). ¿Está California "más cerca" de Carolina del Norte que de Arizona? ¿Puedo hacer esta interpretación?
-
Hawái (a la derecha) se une al grupo bastante tarde. Puedo ver esto ya que es "más alto" que otros estados. En general, ¿cómo puedo interpretar correctamente el hecho de que las etiquetas sean "más altas" o "más bajas" en el dendrograma?
1 votos
Respuestas en
?hclust
.3 votos
Las posiciones de las etiquetas no tienen ningún significado. Si no entiendes el eje y entonces es extraño que tengas la impresión de entender bien la agrupación jerárquica.
1 votos
También hay que tener en cuenta que la agrupación jerárquica generalmente no no te dan clasificación jerárquica (árbol) . El método de la media (que usted utilizó) no lo hace, en particular. Véase el último punto aquí .
1 votos
Sin embargo, la posición de una etiqueta tiene un pequeño significado. Cuanto más alta sea la posición, más tarde se enlazará el objeto con los demás, y por lo tanto, más se parecerá a un objeto atípico o extraviado.
6 votos
@StéphaneLaurent Tienes razón en que esto parece una contradicción. Por otro lado sigo pensando que soy capaz de interpetar un dendograma de datos que conozco bien. Además la posición de los lables tiene un pequeño significado como lo señalan ttnphns y Peter Flom. Finalmente tu comentario no fue constructivo para mi.
1 votos
Perdona si he sido torpe. En efecto, no sabía para las etiquetas. El eje y da las distancias entre clusters, es el ingrediente esencial de la clasificación.