36 votos

Interpretación de la prueba de Shapiro-Wilk

Soy bastante nuevo en las estadísticas y necesito su ayuda.
Tengo una pequeña muestra, como la siguiente:

      H4U
      0.269
      0.357
      0.2
      0.221
      0.275
      0.277
      0.253
      0.127
      0.246

Hice la prueba de Shapiro-Wilk usando R:

shapiro.test(precisionH4U$H4U)

y obtuve el siguiente resultado:

W = 0.9502, p-value = 0.6921

Ahora bien, si asumo el nivel de significación en 0,05, el valor p es mayor que alfa (0,6921 > 0,05) y no puedo rechazar la hipótesis nula sobre la distribución normal, pero ¿me permite decir que la muestra tiene una distribución normal?

34voto

Alan Puntos 7273

No, no se puede decir "la muestra tiene una distribución normal" o "la muestra procede de una población que tiene una distribución normal", sino sólo "no se puede rechazar la hipótesis de que la muestra procede de una población que tiene una distribución normal".

De hecho, la muestra no tiene una distribución normal (véase el qqplot más abajo), pero no se espera que lo haga, ya que es sólo una muestra. La cuestión de la distribución de la población subyacente sigue abierta.

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 
          0.277, 0.253, 0.127, 0.246) )

qqplot

20voto

AdamSane Puntos 1825

No rechazar una hipótesis nula es una indicación de que la muestra que tienes es demasiado pequeña para recoger cualquier desviación de la normalidad que tengas - pero tu muestra es así que pequeño que incluso las desviaciones bastante sustanciales de la normalidad probablemente no se detecten.

Sin embargo, una prueba de hipótesis no tiene mucho sentido en la mayoría de los casos para los que la gente utiliza una prueba de normalidad - usted sabe realmente la respuesta a la pregunta que está probando - la distribución de la población de sus datos se extrae es no va a ser normal. (Puede que a veces se acerque bastante, pero ¿realmente es normal?)

La cuestión que debería preocuparte no es "si la distribución de la que proceden es normal" (no lo será). La pregunta que debería preocuparte es más bien "¿la desviación de la normalidad que tengo va a afectar materialmente a mis resultados?". Si eso es potencialmente un problema, podría considerar un análisis que sea menos probable que tenga ese problema.

12voto

Marcel Lamothe Puntos 133

Teniendo en cuenta que eres bastante nuevo en estadística, sospecho que estás pensando en esto porque son residuos de una estimación de una media y quieres saber si el supuesto de normalidad es válido para las estimaciones de confianza utilizando un $t$ -distribución.

$t$ -Las pruebas son bastante robustas a las violaciones de este supuesto, los datos parecen vagamente normales en el gráfico q-q de Henry, y la prueba de Shapiro no indica que los datos provengan de una población con una distribución no normal, por lo que yo diría que un $t$ -la prueba es apropiada.

Especulo, además, que está buscando proporciones, en cuyo caso podría utilizar una distribución binomial si le preocupan las violaciones de los supuestos.

Si fue alguna otra preocupación la que te llevó a las pruebas de Shapiro, puedes ignorar todo lo que acabo de decir.

4voto

Iwasakabukiman Puntos 518

Como ya dijo Enrique no se puede decir que sea normal. Sólo trata de ejecutar el siguiente comando en R varias veces:

shapiro.test(runif(9)) 

Esto probará la muestra de 9 números de la distribución uniforme. Muchas veces el valor p será mucho mayor que 0,05 - lo que significa que no se puede concluir que la distribución es normal.

4voto

Denis Rasulev Puntos 143

También estaba buscando cómo interpretar correctamente W en la prueba de Shapiro-Wilk y según Emil O. W. Kirkegaard El artículo de la revista " Valores W de la prueba de Shapiro-Wilk visualizados con diferentes conjuntos de datos "es muy difícil decir algo sobre la normalidad de una distribución mirando W valor por sí solo.

Como afirma en su conclusión:

En general, vemos que, dada una muestra grande, el SW es sensible a las desviaciones de la no normalidad. Sin embargo, si la desviación es muy pequeña, no es muy importante.

También vemos que es difícil reducir el valor W aunque se intente deliberadamente. Hay que probar una distribución extremadamente no normal para que caiga apreciablemente por debajo de 0,99.

Véase el artículo original para más información.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X