Le pregunté a una pregunta acerca de la formación de una válida distancia métrica de ayer (Link1) y tiene muy buena respuesta; sin embargo, tengo algunas preguntas más acerca de la formación de una adecuada distancia métrica de alta de datos dimensional.
¿Por qué es el triángulo de la desigualdad, de manera importante para hacer válida la distancia métrica? Tal vez es demasiado amplia para preguntar esto, pero no tengo un ejemplo sencillo en mi mente. No está seguro de si la gente puede pensar en un escenario sencillo para explicar esto con un poco de contexto?
Como lo mencioné en mi post anterior (Link1), creo que la similitud del Coseno es la misma cosa como el producto escalar. Estoy en lo cierto? Si es así, el producto escalar no es válido distancia métrica porque no tiene el triángulo de la desigualdad de la propiedad y etc. Si transformamos la similitud medido por el producto escalar en Angular similitud, va a ser una adecuada distancia métrica?
Con respecto a la distancia Euclidiana, hay otro post (Link2), diciendo que no es una buena métrica en altas dimensiones. Como mi vectores de datos en altas dimensiones del espacio, me pregunto si alguna distancia métrica sufren la maldición de la dimensionalidad?
Con respecto al punto C anterior, teniendo en cuenta la dimensionalidad, una fracción de la distancia métrica de ser una mejor distancia métrica? (Link3)
Muchas gracias! Un