4 votos

Métrica de similitud simple

Estoy tratando de encontrar una simple similitud métricas que se van a comparar los vectores de longitud indeterminada. Estos vectores se rellenan con valores entre 1 y 5. En esta situación, la 1 está más cerca de un 2 a un 5, etc, etc.

Soy nuevo en este tipo de matemáticas. Yo, ingenuamente, considerado el uso de similitud del coseno. Sin embargo, cuando me puse a investigar esto más a fondo me di cuenta de que esto probablemente no fue el mejor métrica para este tipo de cálculo.

Gracias de antemano y pido disculpas por la pregunta de novato.

Nota: voy a ser la programación de este en PHP.

6voto

Akira Puntos 1061

Usted podría utilizar una norma: dados los vectores $\mathbf{x}$$\mathbf{y}$, podemos definir el "2-norma" por $$ ||\mathbf{x} - \mathbf{y}||_2 = \sqrt{\sum_i (x_i - y_i)^2} $$ De manera similar se define el"p-norma" por $$ ||\mathbf{x} - \mathbf{y}||_p = \left(\sum_i |x_i - y_i|^p\right)^{1/p} $$ En el límite, como $p \to \infty$, se obtiene el "infinito norma" $$ ||\mathbf{x} - \mathbf{y}||_\infty = \max_i |x_i - y_i| $$

Nota los dos vectores se supone que ser de la misma longitud! Si usted quiere que su "similitud" métrica para ser razonablemente definido cuando, por ejemplo, comparar dos vectores de longitud 3 o dos vectores de longitud de 300, usted probablemente tiene que normalizar por el tamaño. Es decir, usted debe elegir una métrica de similitud de la forma $$d(\mathbf{x},\mathbf{y}) = \frac{||\mathbf{x} - \mathbf{y}||_p}{n^{1/p}}$$ donde los vectores son de longitud $n$.

edit: (he cambiado de $d$ por encima un poco) para activar esta distancia métrica en una métrica de similitud, me gustaría abuso el hecho de que los vectores son conocidos entre un rango de $1$$5$. Esto me dice que el valor máximo que $d(\mathbf{x},\mathbf{y})$ puede tomar se produce cuando uno es un vector de todos los $1$s y el otro es un vector de todos los $5$s. Para la definición de $d$ anterior, el valor máximo que toma es $4$. La propuesta de métrica similitud es entonces: $$f(\mathbf{x},\mathbf{y}) = 4 - \frac{||\mathbf{x} - \mathbf{y}||_p}{n^{1/p}}$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X