Tengo varios resultados de pruebas de retraso en la respuesta del servidor. Según nuestro análisis teórico, la distribución del retraso (la función de distribución de probabilidad del retraso de la respuesta) debería tener un comportamiento de cola pesada. Pero, ¿cómo puedo demostrar que el resultado de la prueba sigue la distribución de cola pesada?
Respuesta
¿Demasiados anuncios?No estoy seguro de haber interpretado correctamente su pregunta, así que hágamelo saber y podría adaptar o eliminar esta respuesta. En primer lugar, no probar cosas con respecto a nuestros datos, sólo mostramos que algo no es irracional. Eso se puede hacer de varias maneras, una de las cuales es mediante pruebas estadísticas. En mi opinión, sin embargo, si se tiene una distribución teórica preestablecida, el mejor enfoque es simplemente hacer una qq-plot . La mayoría de la gente piensa que los gráficos qq sólo se utilizan para evaluar la normalidad, pero se pueden trazar cuantiles empíricos contra cualquier distribución teórica que se puede especificar. Si se utiliza R, el paquete Car tiene una función aumentada qq.plot() con un montón de buenas características; dos que me gustan son que puedes especificar un número de diferentes distribuciones teóricas más allá de la gaussiana (por ejemplo, podrías a t
para una alternativa de cola más gruesa), y que traza una banda de confianza del 95%. Si no tiene una distribución teórica específica, sino que sólo quiere ver si las colas son más pesadas de lo que se espera de una normal, que puede se puede ver en un gráfico qq, pero a veces puede ser difícil de reconocer. Una posibilidad que me gusta es hacer un gráfico de densidad del núcleo así como un gráfico qq y, además, podrías superponerle una curva normal. El código básico de R es plot(density(data))
. Para un número, se podría calcular el curtosis y ver si es más alto de lo esperado. No conozco funciones enlatadas para la curtosis en R, tienes que codificarla usando las ecuaciones dadas en la página enlazada, pero no es difícil de hacer.