La distancia euclidiana (norma de la diferencia) y la predicción de puntos son proporcionales entre sí mientras que ellos son no son iguales, pero sí aproximadamente iguales .
Tras la normalización $a$ y $b$ tal que $\|a\| = 1$ y $\|b\| = 1$ , estas tres medidas están relacionadas como:
Distancia euclidiana = $\| a - b \| = \sqrt{\| a \|^2 + \|b\|^2 - 2 a^Tb} =\sqrt{2 - 2 \cos(\theta_{ab})}$
Producto de puntos = $\|a\|\|b\| \cos(\theta_{ab}) = 1 \cdot 1 \cdot \cos(\theta_{ab}) = \cos(\theta_{ab}) $
Coseno = $\cos(\theta_{ab})$
Por lo tanto, las tres medidas de similitud son equivalentes porque son proporcionales a $\cos(\theta_{ab})$ .
Esto es también se discute aquí y en el Modelo de espacio vectorial: similitud del coseno frente a la distancia euclidiana hilo y Wikipedia . Incluso hubo una evaluación empírica por parte de Qian et al (2004) concluyendo que
Mediante nuestro análisis teórico y los resultados experimentales, concluimos que EUD y CAD son similares cuando se aplican a consultas NN de alta dimensión de alta dimensión. Para los datos normalizados y los datos agrupados, EUD y CAD se vuelven aún más similares.
Ambas métricas son similares y no hay razones de peso para preferir una sobre otra en general.