12 votos

"Al Revés" De Shapiro–Wilk

El Sharipo-Wilk prueba, según la wikipedia, las pruebas, el contraste de hipótesis ($H_0$) "La población está normalmente distribuida".

Estoy buscando una similar test de normalidad de $H_0$ "de La población no está normalmente distribuida".

Tener una prueba, quiero calcular un $p$-valor para rechazar $H_0$ con un nivel de significación $\alpha$ fib $p < \alpha$; demostrando que mi población está normalmente distribuida.

Por favor, tenga en cuenta que el uso de Sharipo-Wilk prueba y la aceptación de $H_0$ fib $p > \alpha$ es un enfoque incorrecto , ya que, literalmente, significa "no tenemos suficiente evidencia para probar que H0 no es".

Temas relacionados con - significado de $p$-valor, es la normalidad de las pruebas inútiles?, pero no veo una solución a mi problema.

Las preguntas: cuál es la prueba Que debo usar? Es implementado en R?

10voto

Sean Hanley Puntos 2428

No hay tal cosa como una prueba de que sus datos están distribuidos normalmente. Sólo hay pruebas de que sus datos no siguen una distribución normal. Por lo tanto, hay pruebas, como la de Shapiro-Wilk donde $H_0\!: \rm normal$ (hay muchos otros), pero no hay pruebas en las que el null es que la población no es normal, y la hipótesis alternativa es que la población es normal.

Todo lo que puedes hacer es averiguar a qué tipo de desviación de la normalidad que te importa (por ejemplo, la asimetría), y cómo de grande que la desviación tendría que ser antes de ser molestado. Entonces usted puede probar para ver si la desviación de perfecta normalidad de los datos fue menor que el crítico cantidad. Para obtener más información sobre la idea general de lo que podría ayudar a leer mi respuesta a esta pregunta: ¿por Qué los estadísticos dicen que no significativos resultado significa que "no se puede rechazar la nula", por oposición a la aceptación de la hipótesis nula?

5voto

Kevin Zink Puntos 81

Quiero calcular el p-valor para rechazar H0 al nivel de significación α iff p<α; demostrando que mi población está normalmente distribuida.

La distribución normal se presenta cuando la información es generada por una serie de aditivos iid eventos (véase la tresbolillo imagen de abajo). Eso significa que no hay retroalimentación y que no hay correlaciones, hace que el sonido es como el proceso que llevan a sus datos? Si no, probablemente no es normal.

Existe la posibilidad de que tipo de proceso puede estar ocurriendo en su caso. Lo más cerca que puede llegar a "probar" es para recopilar datos suficientes para descartar cualquier otra distribución que la gente puede venir con (que probablemente no es práctico). Otra manera es deducir la distribución normal a partir de la teoría junto con algunas otras predicciones. Si los datos son consistentes con todos ellos y nadie puede pensar en otra explicación, a continuación, que sería una buena evidencia a favor de la distribución normal.

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.pnghttps://en.wikipedia.org/wiki/Bean_machine

Ahora bien, si usted no espera ninguna distribución específica a priori puede ser razonable utilizar la distribución normal para resumir los datos, pero hay que reconocer que este es esencialmente una opción fuera de la ignorancia (https://en.wikipedia.org/wiki/Principle_of_maximum_entropy). En este caso no se quiere saber si la población está normalmente distribuida, más bien, desea saber si la distribución normal es una aproximación razonable para lo que su siguiente paso.

En ese caso, usted debe proporcionar su información (o datos generados que es similar), junto con una descripción de lo que usted planea hacer con él, entonces, preguntar "¿De qué manera puede suponiendo normalidad en este caso inducir a error a mí?"

2voto

TrynnaDoStat Puntos 3590

Usted nunca será capaz de "probar" un supuesto de Normalidad en los datos. Sólo ofrecer pruebas en su contra como una suposición. El test de Shapiro-Wilk es una forma de hacer esto y se usa todo el tiempo para justificar el supuesto de Normalidad. El razonamiento es que empieces por el supuesto de Normalidad. Usted se pregunte, ¿ mis datos sugieren estoy haciendo una tonta suposición? Así que adelante y probar con la de Shapiro-Wilk. Si no se puede rechazar la hipótesis nula, a continuación, los datos no sugieren que está haciendo una tonta suposición.

Aviso, la gente utiliza esta lógica similar todo el tiempo en la práctica - no sólo en el contexto de los test de Shapiro-Wilk. Quieren utilizar la regresión lineal, mira un $Y, X$ diagrama de dispersión y ver si la regresión lineal es una idea tonta. O, asumen la heterocedasticidad y la trama términos de error para ver si esto es una idea tonta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X