6 votos

¿Qué opciones hay para combinar diferentes funciones de distancia?

Actualmente estoy trabajando con vectores de características que se componen de atributos continuos, por lo que puedo utilizar la distancia euclidiana para cosas como la clasificación KNN y la agrupación. Ahora quiero añadir un atributo nominal que tiene una función de distancia especial definida. ¿Qué opciones tengo para combinar estas funciones de distancia, de modo que siga obteniendo una distancia para dos vectores?

7voto

ESRogs Puntos 1381

Se me ocurren tres:

  1. Combínelos de forma lineal ( $d=d_1+\alpha d_2$ ) y encontrar la mejor $\alpha$ por alguna optimización, digamos minimizar el error CV para kNN o minimizar la silueta para el clustering.
  2. Entrene clasificadores separados/agrupe los datos varias veces basándose en ambas distancias y luego mezcle los resultados. Esto puede no funcionar demasiado bien porque sólo tienes 2 métodos base.
  3. Sólo para la clasificación, puede utilizar "klNN" -- obtener $k$ vecinos basados en la primera métrica y $l$ basado en el segundo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X