Estoy escribiendo un script que analiza los tiempos de ejecución de procesos. No estoy seguro de su distribución, pero quiero saber si se ejecuta el proceso "muy largo". Hasta ahora he estado usando 3 desviaciones estándar de los últimos tiempos de ejecución (n>30), pero me dijeron que no ofrece nada útil si los datos no es normal (lo cual no parece ser). He encontrado otro valor atípico prueba de que los estados:
Encontrar el inter cuartil rango, que es IQR = Q3 - Q1, donde Q3 es el tercer cuartil y Q1 es el primer cuartil. Luego de encontrar a estos dos números:
a) Q1 - 1.5*IQR b) Q3 + 1.5*IQR
El punto es un valor atípico si < o > b
Mis datos tiende a ser cosas como 2sec, 3sec, 2 seg, 5 seg, 300 s, 4sec, .... donde 300 s es, obviamente, un valor atípico.
Qué método es el mejor? El IQR método o la desviación std método?