Tengo una imagen hiperespectral donde los píxeles son 21 canales. Así que cada píxel $\in \mathbb{R}^{21}$. Quiero realizar la agrupación de los píxeles con similitud definida por dos medidas diferentes, uno que tan cerca están los píxeles, y el otro la similitud de los valores de los píxeles.
Por lo tanto si $X_1$ $X_2$ son las ubicaciones de los píxeles $p_1$ $p_2$ me han: $$S_X = \|X_1-X_2\|^2_2$$ y $$S_p = \|p_1-p_2\|^2_2$$.
He visto estas medidas combinadas en una sola medida como esta: $$ S= e^{-\frac{S_p}{\sigma^2_p}} \times \,\, e^{-\frac{S_X}{\sigma^2_X}} $$
Mi pregunta: ¿hay una forma correcta y una forma incorrecta de combinar medidas como esta, o si mejora mi agrupación puedo combinar las medidas de cualquier manera que se adapte a mí?
Mi pregunta es vagamente relacionadas con la Combinación de varias medidas de similitud.