6 votos

K-means Mahalanobis vs distancia Euclidiana

Actualmente estoy tratando de clúster "tipos" de los cambios en bitemporal multiespectral de imágenes de satélite.

He aplicado una cosa que se llama un loco transformar a ambas imágenes, 5000 x 5000 píxeles x 5 bandas. Cada banda es una "variable" como es el resplandor de la información a partir de una diferente espectro de la luz. Esta transformación es básicamente equivalente a PC aplicados a la resta de ambas imágenes.

Naturalmente me puede conseguir hasta 5 mad componentes. Ahora me gustaría encontrar ... excatly este... los tipos de cambio en estos componentes. Si yo uso K-means sobre los componentes que me gustaría utilizar una distancia euclidiana, pero yo sólo quería saber lo que podría ser el aumento en el uso de una distancia de mahalanobis si hay alguna... Sólo por curiosidad. Saludos y lo siento por la publicación de una TERRIBLE pregunta antes. En realidad yo sólo quería un tipo de resumen de las dos opciones.

Julián.

6voto

Mike Puntos 1018

No he entendido el tipo de transformación que se utilizan, así que mi respuesta va a ser un general. La respuesta corta es: ¿cuánto va a ganar usando la distancia de Mahalanobis realmente depende de la forma de agrupaciones naturales (es decir, clusters) en sus datos.

La elección de la utilización de Mahalanobis vs distancia Euclidiana en k-means es realmente una elección entre el uso de la lleno-covarianza de sus clusters o hacer caso omiso de ellas. Cuando se utiliza la distancia Euclídea, se asume que los clusters tienen identidad de covarianzas. En 2D, esto significa que los clusters tienen formas circulares. Obviamente, si las covarianzas de los naturales de las agrupaciones de los datos no son de la identidad de las matrices, por ejemplo, en 2D, los clusters tienen forma elíptica covarianzas, a continuación, el uso de Mahalanobis sobre Euclidiana será mucho mejor modelado.

Usted puede probar ambos y ver si es o no el uso de la distancia de Mahalanobis le da una ganancia significativa. Depende también de lo que va a hacer después de la agrupación. La agrupación en sí no suele ser el objetivo final. Probablemente el uso de los clusters en algunos posterior procesamiento. Así, la elección de la Euclídea vs Mahalanobis puede ser determinado por el rendimiento de su procesamiento posterior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X