En la agrupación de métodos tales como K-means, la distancia euclídea es la métrica a utilizar. Como resultado, sólo nos calcular la media de los valores dentro de cada clúster. Y, a continuación, se realizan ajustes en los elementos en base a su distancia a cada valor de la media.
Me preguntaba por qué la función de Gauss no se utiliza como métrica? En lugar de utilizar xi -mean(X)
, podemos usar exp(- (xi - mean(X)).^2/std(X).^2)
. Así, no sólo la similitud entre los grupos son medidos (media), pero la similitud en el marco del grupo es también considerado (ets). Esto es equivalente al modelo de mezcla de Gaussianas?
Es más allá de mi pregunta, pero me parece que mean-shift puede surgir la misma pregunta de arriba.