¿Alguien usa el $L_1$ o $L_.5$ métricas para la agrupación, en lugar de $L_2$ ?
Aggarwal et al.,
En el sorprendente comportamiento de la distancia, las métricas de alta el espacio tridimensional
dijo (en 2001) que
$L_1$ es consistentemente más preferible a continuación, la distancia Euclidiana métrica $L_2$ para grandes dimensiones de minería de datos aplicaciones
y afirmó que $L_.5$ o $L_.1$ puede ser mejor aún.
Razones para el uso de $L_1$ o $L_.5$ puede ser teórico o experimental, por ejemplo, la sensibilidad a los valores atípicos / Kabán los papeles, o los programas se ejecutan en real o sintético de datos (reproducible por favor). Un ejemplo, o una imagen que me ayudara a mi laico de la intuición.
Esta pregunta es una pregunta de seguimiento a Bob Durrant, la respuesta a Cuando-es-vecino más cercano-significativo-el día de hoy. Como él dice, la elección de $p$ datos y depende de la aplicación; sin embargo, informes de la experiencia real, sería útil.
Notas agregadas martes 7 de junio:
Me topé con "Análisis estadístico de datos basado en la L1-norma y métodos relacionados", Dodge ed., 2002, 454p, isbn 3764369205 — decenas de documentos de la conferencia.
¿Alguien puede analizar distancia de concentración para el yo.yo.d. exponencial características ? Una de las razones por las exponenciales es que $|exp - exp| \sim exp$; otro (no experto) es que es el máximo de entropía de la distribución de $\ge$ 0; una tercera es que algunos de los verdaderos conjuntos de datos, en particular, Criba, mira aproximadamente exponencial.