22 votos

Motivo para normalizar en medidas de distancia euclidianas en agrupación jerárquica

Aparentemente, en el agrupamiento jerárquico en el que la medida de distancia es la distancia euclidiana, los datos primero deben normalizarse o estandarizarse para evitar que la covariable con la mayor varianza conduzca el agrupamiento. ¿Por qué es esto? ¿No es este hecho deseable?

4voto

mat_geek Puntos 1367

Anony-Mousse dio una excelente respuesta. Solo añadiría que la métrica de distancia que tiene sentido dependería de la forma de las distribuciones multivariadas. Para el gaussiano multivariante, la distancia de Mahalanobis es la medida apropiada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X