2 votos

LOF (Local Outlier Factor) eligiendo el valor de k

Sólo quiero entender una cosa. Digamos que para cualquier conjunto de datos selecciono k=20 y genero LOF para cada punto y luego muestro todos los puntos en orden descendente de su LOF. Ahora cuando estoy analizando los datos puedo elegir el rango hasta el cual creo que los datos son un valor atípico (según el conocimiento del dominio)

¿Crees que esto ayuda? Sólo a mí, ya que ahora no tengo que preocuparme por el valor de k y estoy utilizando mi conocimiento del dominio para analizar los valores atípicos según la clasificación LOF.

1voto

Devon Parsons Puntos 206

Este parece un enfoque viable. El umbral para distinguir los valores atípicos de los inliers debe ser totalmente determinado por usted, pero utilizando su conocimiento del dominio esto parece funcionar.

Me gustaría remitirle a la documento original que describe la LOF para entender sus desventajas (aunque la wikipedia es un buen comienzo también).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X