Aparentemente, en el agrupamiento jerárquico en el que la medida de distancia es la distancia euclidiana, los datos primero deben normalizarse o estandarizarse para evitar que la covariable con la mayor varianza conduzca el agrupamiento. ¿Por qué es esto? ¿No es este hecho deseable?
Respuesta
¿Demasiados anuncios?
mat_geek
Puntos
1367
Anony-Mousse dio una excelente respuesta. Solo añadiría que la métrica de distancia que tiene sentido dependería de la forma de las distribuciones multivariadas. Para el gaussiano multivariante, la distancia de Mahalanobis es la medida apropiada.