Estoy tratando de automatizar la detección de valores atípicos en series de tiempo y he usado una modificación de la solución propuesta por Rob Hyndman aquí.
Decir, yo medida diaria de visitas a un sitio web de diversos países. Para algunos países donde las visitas diarias son un par de hundrends o miles, mi método parece funcionar razonablemente.
Sin embargo, en los casos en que un país lleva a sólo 1 o 2 visitas por día, de los límites del algoritmo son muy estrecho (por ejemplo, 1 ± 0,001) y por lo tanto el 2 visitas son considerados como un valor atípico. ¿Cómo podría yo detectar automáticamente estos casos ¿y cómo tratarlos para identificar valores atípicos? No me gustaría establecer un manual de umbral de, digamos, 100 visitas por día.
Gracias!