7 votos

¿Hay alguna ventaja en elevar al cuadrado las disimilitudes cuando se utiliza la agrupación de Ward?

¿Existe alguna razón para preferir elevar al cuadrado o no elevar al cuadrado las disimilitudes al agrupar con el método de Ward?

La pregunta está motivada por la siguiente afirmación del documentación para R's hclust() función:

En la literatura se encuentran dos algoritmos diferentes para la agrupación de Ward. El utilizado por la opción " ward.D " (equivalente a la única opción de Ward " ward " en versiones de R <= 3.0.3) no aplican el criterio de agrupación de Ward (1963), mientras que la opción " ward.D2 "implementa ese criterio (Murtagh y Legendre 2013). Con este último, las disimilitudes son al cuadrado antes de la actualización del clúster.

¿La cuadratura mejora el algoritmo?

1 votos

Uhm. A menos que muestre los resultados de los dos métodos, junto con la matriz de entrada, esa pregunta se vería como puramente R pregunta.

4voto

Bill Totman Puntos 9

Desde el Conclusión de Murtaugh, F. y Legendre, P. (2011). Método de agrupación jerárquica de Ward: Criterio de agrupación y algoritmo aglomerativo , ArXive:1111.6285v2 ( pdf ):

Dos algoritmos, Sala1 y Sala2 ...Cuando se aplican a la misma matriz de distancia D, producen resultados diferentes. Este artículo ha demostrado que cuando se aplican a la misma matriz de disimilitud D, sólo Ward2 minimiza el criterio de agrupación de Ward y produce el método de Ward. Se puede hacer que los algoritmos Ward1 y Ward2 optimicen el mismo criterio y produzcan la misma topología de agrupación utilizando Ward1 con D-cuadrado y Ward2 con D.

Por ejemplo, hclust(dist(x)^2,method="ward") equivale a hclust(dist(x),method="ward.D2") .

0 votos

Eso no responde a la pregunta sobre la calidad...

1voto

Amadiere Puntos 5606

A juzgar por la explicación, ward en R se implementó por primera vez de forma incorrecta.

Sólo en las últimas versiones se ha añadido una versión corregida de la vinculación de la sala, como ward.D2 . Por lo tanto, si desea utilizar la vinculación de la sala, utilice ward.D2 .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X