7 votos

Cuándo utilizar el producto punto como métrica de similitud

Estoy tratando de entender qué medida de similitud debe utilizarse en qué situaciones.

  • A grandes rasgos, ¿cuándo debería alguien utilizar el producto punto para evaluar la similitud entre vectores?
  • A grandes rasgos, ¿cuándo debería alguien utilizar la norma de la diferencia de vectores para evaluar la similitud entre vectores?
  • ¿Cuáles son los pros y los contras de estos enfoques?

No busco una respuesta específica sobre cuál debo usar para un problema concreto. Me pregunto de forma más general sobre cuándo se debe esperar que estos enfoques funcionen bien.

4voto

Dipstick Puntos 4869

La distancia euclidiana (norma de la diferencia) y la predicción de puntos son proporcionales entre sí mientras que ellos son no son iguales, pero sí aproximadamente iguales .

Tras la normalización $a$ y $b$ tal que $\|a\| = 1$ y $\|b\| = 1$ , estas tres medidas están relacionadas como:

Distancia euclidiana = $\| a - b \| = \sqrt{\| a \|^2 + \|b\|^2 - 2 a^Tb} =\sqrt{2 - 2 \cos(\theta_{ab})}$

Producto de puntos = $\|a\|\|b\| \cos(\theta_{ab}) = 1 \cdot 1 \cdot \cos(\theta_{ab}) = \cos(\theta_{ab}) $

Coseno = $\cos(\theta_{ab})$

Por lo tanto, las tres medidas de similitud son equivalentes porque son proporcionales a $\cos(\theta_{ab})$ .

Esto es también se discute aquí y en el Modelo de espacio vectorial: similitud del coseno frente a la distancia euclidiana hilo y Wikipedia . Incluso hubo una evaluación empírica por parte de Qian et al (2004) concluyendo que

Mediante nuestro análisis teórico y los resultados experimentales, concluimos que EUD y CAD son similares cuando se aplican a consultas NN de alta dimensión de alta dimensión. Para los datos normalizados y los datos agrupados, EUD y CAD se vuelven aún más similares.

Ambas métricas son similares y no hay razones de peso para preferir una sobre otra en general.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X