20 votos

Una rutina para elegir eps y minPts para DBSCAN

DBSCAN es el algoritmo de agrupamiento más citado de acuerdo con algunas publicaciones y puede encontrar grupos de formas arbitrarias según la densidad. Tiene dos parámetros: eps (como radio de vecindario) y minPts (como vecinos mínimos para considerar un punto como punto central), que creo que depende mucho de ellos.

¿Hay algún método de rutina o comúnmente usado para elegir estos parámetros?

21voto

Amadiere Puntos 5606

Hay un montón de publicaciones que proponen métodos para la selección de estos parámetros.

La más notable es la ÓPTICA, un DBSCAN variación que se hace con el parámetro épsilon; produce un jerárquica resultado que puede casi considerarse como "ejecución de DBSCAN con cada posible epsilon".

Para minPts, yo sugiero que no se basan en un método automático, pero en su dominio de conocimiento.

Un buen algoritmo de clustering tiene parámetros, que permiten personalizar a sus necesidades.

Un parámetro que se le pasa por alto es la función de distancia. La primera cosa a hacer para DBSCAN es encontrar una buena función de distancia para su aplicación. No dependen de la distancia Euclídea ser el mejor para cada aplicación!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X