8 votos

Pruebas de normalidad inconsistentes: Kolmogorov-Smirnov vs Shapiro-Wilk

Actualmente estoy investigando algunos datos que fueron producidos por una simulación de MC que escribí - espero que los valores estén distribuidos normalmente. Naturalmente, hice un histograma y parece razonable (supongo?):

[Arriba a la izquierda: histograma con dist.pdf(), arriba a la derecha: histograma acumulado con dist.cdf(), abajo: gráfico QQ, data vs dist]

Luego decidí investigar más a fondo esto con algunas pruebas estadísticas. (Nota que dist = stats.norm(loc=np.mean(data), scale=np.std(data)).) Lo que hice y los resultados que obtuve fueron los siguientes:

  1. Prueba de Kolmogorov-Smirnov:

    scipy.stats.kstest(data, 'norm', args=(data_avg, data_sig))
    KstestResult(statistic=0.050096921447209564, pvalue=0.20206939857573536)
  2. Prueba de Shapiro-Wilk:

    scipy.stats.shapiro(dat)
    (0.9810476899147034, 1.3054057490080595e-05)
    # donde el primer valor es la estadística de prueba y el segundo es el valor p.
  3. Gráfico QQ:

    stats.probplot(dat, dist=dist)

Mis conclusiones serían:

  • al observar el histograma y el histograma acumulado, definitivamente asumiría una distribución normal

  • lo mismo se mantiene después de ver el gráfico QQ (¿realmente puede mejorar mucho más?)

  • la prueba KS dice: 'sí, esto es una distribución normal'

mi confusión es: la prueba SW dice que no está distribuido normalmente (el valor p es mucho más pequeño que el nivel de significancia alpha=0.05, y la hipótesis inicial era una distribución normal). No entiendo esto, ¿alguien tiene una mejor interpretación? ¿Cometí un error en algún punto?

5 votos

Los QQplots para normalidad pueden ser mejores que eso: intenta graficar algunos normales aleatorios del mismo tamaño de muestra para obtener un punto de referencia. Tienes una ligera no normalidad, como lo indica la curvatura sistemática en el QQplot. Los histogramas y los gráficos de distribución acumulada son menos útiles para trabajos precisos. Yo no privilegiaría K-S aquí; tiende a ser más sensible en el centro de una distribución que en las colas, lo cual es lo contrario de lo que necesitas. S-W es una prueba, y no (¡no puede!) mide qué tan problemática es la no normalidad.

0 votos

No puedo comentar sobre tu uso de Python. Preguntar sobre software específico suele estar fuera de tema aquí a menos que la consulta sea esencialmente estadística.

0 votos

No podemos comentar sobre sus motivos para esperar una distribución normal; ¿qué diferencia haría una ligera falta de normalidad en su proyecto?

6voto

Sean Hanley Puntos 2428

Hay innumerables formas en que una distribución puede diferir de una distribución normal. Ninguna prueba podría capturar todas ellas. Como resultado, cada prueba difiere en cómo verifica si tu distribución coincide con la normal. Por ejemplo, la prueba KS examina el cuantil donde tu función de distribución acumulada empírica difiere al máximo de la función de distribución acumulada teórica de la normal. A menudo, esto se encuentra en algún lugar en medio de la distribución, que no es donde típicamente nos importan las discrepancias. La prueba SW se centra en las colas, que es donde normalmente sí nos importa si las distribuciones son similares. Como resultado, la preferible suele ser la SW. Además, la prueba KW no es válida si estás utilizando parámetros de distribución que fueron estimados a partir de tu muestra (ver: ¿Cuál es la diferencia entre la prueba de normalidad de Shapiro-Wilk y la prueba de normalidad de Kolmogorov-Smirnov?). Deberías usar la SW aquí.

Pero generalmente se recomiendan los gráficos y no las pruebas (ver: ¿La prueba de normalidad es 'esencialmente inútil'?). Puedes ver en todos tus gráficos que tienes una cola derecha pesada y una cola izquierda ligera en comparación con una verdadera distribución normal. Es decir, tienes un poco de asimetría a la derecha.

2voto

Aksakal Puntos 11351

No puedes seleccionar pruebas de normalidad basadas en los resultados. En este caso, debes ir con el rechazo en cualquier prueba realizada, o no usarlas en absoluto. La prueba KS no es muy potente, no es una prueba de normalidad "especializada". Si acaso, SW es probablemente más confiable en este caso.

Para mí, tu gráfico QQ tiene signos de tener una cola derecha gruesa o sesgo hacia la izquierda, o ambos. Te sugeriría usar la herramienta de Tukey para estudiar la grosor de las colas. Te dará una indicación de cuánto se parece una distribución a una normal o Cauchy.

0 votos

¿Cómo concluyes a partir de los gráficos QQ sobre la gordura de las colas? Y: ¿qué distribución sugerirías?

1 votos

@rammelmuller, las colas más gruesas mostrarían una curva en forma de S donde la izquierda baja y la derecha sube. En tu caso, la izquierda también sube, lo cual podría ser un signo de asimetría hacia la izquierda.

0 votos

Gracias por señalar la herramienta, la revisaré. Solo por completar: tengo algunos otros conjuntos de datos y los resultados a veces difieren ligeramente: la cola superior del QQ plot varía, pero la cola inferior siempre está un poco alta, ¿un signo de asimetría?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X