24 votos

¿Cómo puedo convertir de distancia (distancia Euclídea) para la puntuación de similitud

Yo estoy usando el $k$ significa que la agrupación en clúster de altavoz de las voces. Cuando me comparan con un sonido de clúster altavoz de datos puedo obtener (distancia Euclidiana) basado en el promedio de la distorsión. Esta distancia puede estar en el rango de $[0,\infty]$. Quiero convertir esta distancia a un $[0,1]$ puntuación de similitud. Por favor me guía sobre cómo puedo lograr esto.

31voto

TrynnaDoStat Puntos 3590

Si $d(p_1,p_2)$ representa la distancia euclidiana desde el punto de $p_1$ a punto de $p_2$,

$$\frac{1}{1 + d(p_1, p_2)}$$

se utiliza comúnmente.

15voto

Usted podría también utilizar: $\frac{1}{e^{dist}}$ donde dist es su distancia deseada de la función.

13voto

user777 Puntos 10934

Parece que quieres algo parecido a la similitud del coseno, que es en sí mismo una puntuación de similitud en la unidad de intervalo. De hecho, una relación directa entre la distancia Euclídea y similitud del coseno existe!

Observar que $$ ||x-x^\prime||^2=(x-x^\prime)^T(x-x^\prime)=||x||+||x^\prime||-2||x-x^\prime||. $$

Mientras que la similitud del coseno es $$ f(x,x^\prime)=\frac{x^T x^\prime}{||x||||x^\prime||}=\cos(\theta) $$ where $\theta$ is the angle between $x$ and $x^\prime$.

Al $||x||=||x^\prime||=1,$ hemos $$ ||x-x^\prime||^2=2(1-f(x,x^\prime)) $$ y $$ f(x,x^\prime)=x^T x^\prime, $$

así

$$ 1-\frac{||x-x^\prime||^2}{2}=f(x,x^\prime)=\cos(\theta) $$ en este caso especial.

Desde una perspectiva computacional, puede ser más eficiente que acaba de calcular el coseno, en lugar de la distancia Euclídea y, a continuación, realizar la transformación.

10voto

exclucid Puntos 1

Cómo sobre un núcleo Gaussiano ?

$K(x, x') = \exp\left( -\frac{\| x - x' \|^2}{2\sigma^2} \right)$

La distancia $\|x - x'\|$ es utilizado en el exponente. El núcleo de valor está en el rango de $[0, 1]$. Hay un parámetro de ajuste $\sigma$. Básicamente si $\sigma$ es alta, $K(x, x')$ será cercano a 1 para cualquier $x, x'$. Si $\sigma$ es baja, con una ligera distancia de $x$ $x'$va a llevar a $K(x,x')$ estar cerca de 0.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X