8 votos

Una métrica de distancia válida para datos de alta dimensión

Le pregunté a una pregunta acerca de la formación de una válida distancia métrica de ayer (Link1) y tiene muy buena respuesta; sin embargo, tengo algunas preguntas más acerca de la formación de una adecuada distancia métrica de alta de datos dimensional.

  1. ¿Por qué es el triángulo de la desigualdad, de manera importante para hacer válida la distancia métrica? Tal vez es demasiado amplia para preguntar esto, pero no tengo un ejemplo sencillo en mi mente. No está seguro de si la gente puede pensar en un escenario sencillo para explicar esto con un poco de contexto?

  2. Como lo mencioné en mi post anterior (Link1), creo que la similitud del Coseno es la misma cosa como el producto escalar. Estoy en lo cierto? Si es así, el producto escalar no es válido distancia métrica porque no tiene el triángulo de la desigualdad de la propiedad y etc. Si transformamos la similitud medido por el producto escalar en Angular similitud, va a ser una adecuada distancia métrica?

  3. Con respecto a la distancia Euclidiana, hay otro post (Link2), diciendo que no es una buena métrica en altas dimensiones. Como mi vectores de datos en altas dimensiones del espacio, me pregunto si alguna distancia métrica sufren la maldición de la dimensionalidad?

  4. Con respecto al punto C anterior, teniendo en cuenta la dimensionalidad, una fracción de la distancia métrica de ser una mejor distancia métrica? (Link3)

Muchas gracias! Un

7voto

Amadiere Puntos 5606

Para datos de alta dimensión, compartido-vecino más cercano de distancias se han reportado para trabajar en

Houle et al., Puede Compartido Vecino Distancias Vencer la Maldición de la Dimensionalidad? Científicos y Estadísticos de Gestión de Base de datos. Lecture Notes in Computer Science 6187. p. 482. doi:10.1007/978-3-642-13818-8_34

Fracciones de distancias se sabe que no métrica. $L_p$ es sólo una métrica para $p\geq 1$, usted encontrará esta restricción en cada prueba de las propiedades métricas de Minkowski normas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X