¿Existe alguna razón para preferir elevar al cuadrado o no elevar al cuadrado las disimilitudes al agrupar con el método de Ward?
La pregunta está motivada por la siguiente afirmación del documentación para R's hclust()
función:
En la literatura se encuentran dos algoritmos diferentes para la agrupación de Ward. El utilizado por la opción "
ward.D
" (equivalente a la única opción de Ward "ward
" en versiones de R <= 3.0.3) no aplican el criterio de agrupación de Ward (1963), mientras que la opción "ward.D2
"implementa ese criterio (Murtagh y Legendre 2013). Con este último, las disimilitudes son al cuadrado antes de la actualización del clúster.
¿La cuadratura mejora el algoritmo?
1 votos
Uhm. A menos que muestre los resultados de los dos métodos, junto con la matriz de entrada, esa pregunta se vería como puramente
R
pregunta.