Yo estoy usando el $k$ significa que la agrupación en clúster de altavoz de las voces. Cuando me comparan con un sonido de clúster altavoz de datos puedo obtener (distancia Euclidiana) basado en el promedio de la distorsión. Esta distancia puede estar en el rango de $[0,\infty]$. Quiero convertir esta distancia a un $[0,1]$ puntuación de similitud. Por favor me guía sobre cómo puedo lograr esto.
Respuestas
¿Demasiados anuncios?Parece que quieres algo parecido a la similitud del coseno, que es en sí mismo una puntuación de similitud en la unidad de intervalo. De hecho, una relación directa entre la distancia Euclídea y similitud del coseno existe!
Observar que $$ ||x-x^\prime||^2=(x-x^\prime)^T(x-x^\prime)=||x||+||x^\prime||-2||x-x^\prime||. $$
Mientras que la similitud del coseno es $$ f(x,x^\prime)=\frac{x^T x^\prime}{||x||||x^\prime||}=\cos(\theta) $$ where $\theta$ is the angle between $x$ and $x^\prime$.
Al $||x||=||x^\prime||=1,$ hemos $$ ||x-x^\prime||^2=2(1-f(x,x^\prime)) $$ y $$ f(x,x^\prime)=x^T x^\prime, $$
así
$$ 1-\frac{||x-x^\prime||^2}{2}=f(x,x^\prime)=\cos(\theta) $$ en este caso especial.
Desde una perspectiva computacional, puede ser más eficiente que acaba de calcular el coseno, en lugar de la distancia Euclídea y, a continuación, realizar la transformación.
Cómo sobre un núcleo Gaussiano ?
$K(x, x') = \exp\left( -\frac{\| x - x' \|^2}{2\sigma^2} \right)$
La distancia $\|x - x'\|$ es utilizado en el exponente. El núcleo de valor está en el rango de $[0, 1]$. Hay un parámetro de ajuste $\sigma$. Básicamente si $\sigma$ es alta, $K(x, x')$ será cercano a 1 para cualquier $x, x'$. Si $\sigma$ es baja, con una ligera distancia de $x$ $x'$va a llevar a $K(x,x')$ estar cerca de 0.