4 votos

La interpretación de pruebas de normalidad de los resultados

He a $35$ puntos de datos y a mí. Estos son los valores medios calculados a partir de una población humana. El uso de un software estadístico, he realizado las pruebas de normalidad - Shapiro Wilk, de Jarque-Bera, Anderson-Darling. El conjunto de datos superado todas estas tres pruebas (p(normal) los valores fueron mayores que los de $\alpha$= $0.05$) por lo tanto, la hipótesis nula de que estos valores de la media pertenece a una población que se distribuye normalmente fue aceptada. A continuación, he trazado la correspondiente histograma. Pero su no vi este tipo de distribución normal. El histograma fue positivamente sesgada. Y cuando he aumentado el tamaño de un recipiente de 4 a 6 encontré la distribución bimodal. Ahora, no entiendo cómo interpretar las pruebas de normalidad de los resultados?

enter image description here

enter image description here

Los 35 valores de los datos son:

3.092756417, 2.42970367, 2.672162617, 2.724095487, 3.241397572, 2.889870095, 
3.06717103, 3.367232596, 3.50428447, 3.502092638, 2.756195965, 3.195877988, 
3.947919563, 3.039449873, 3.271063048, 2.467537862, 3.809382378, 2.613748277, 
2.40550882, 3.299434613, 2.735915946, 3.187394643, 3.223552688, 2.614370296, 
2.674806202, 2.638087031, 2.589459676, 2.460064912, 2.555203245, 2.153496203, 
3.591850829, 2.274449589, 2.25529134,  2.202203377, 2.535145726 

5voto

AdamSane Puntos 1825

Histogramas - especialmente aquellas con pocas papeleras - a veces puede ser muy engañoso (Ver aquí para algunos de abrir los ojos de los ejemplos).

De hecho, esto es parte de lo que está pasando aquí-cambiando de 4 a 6 cubos, o incluso donde el primer bin comienza parece tener algunos efectos importantes en la impresión generada por el histograma. Una cosa a tener en cuenta es que el número de valores en cada bin aquí son muy pequeños, así que un poco de incertidumbre se adhiere a las impresiones que recibe.

Por ejemplo, con sus datos, y el uso de 4 contenedores así como su primer argumento, un simple cambio de bin-origen produce muy diferentes impresiones (en lugar de mover las bandejas, me mudé a los datos, pero la apariencia de la trama es la misma como el movimiento de los cubos de basura de la otra dirección):

four histograms with shifted bins

Por otro lado, no hay suficientes puntos de datos a utilizar una gran cantidad de contenedores, así que no hay mucho que hacer al respecto. Me gustaría sugerir el uso de alrededor de 8 bandejas y tratando de obtener más de una bandeja de origen.


¿Qué tenemos aquí?

En primer lugar, la muestra es casi seguro que no, en realidad extraída de una población normal. La normalidad es un modelo, que a menudo puede ser útil, pero es improbable que en realidad describe la población.

Sin embargo, la muestra es bastante consistente con el hecho de ser extraída de una distribución normal - no se puede discernir la no-normalidad el uso de los tests aplicados. Incluso si no se puede, esto no indica que no se debe utilizar la normalidad como un modelo. Esa decisión es más como un efecto-problema de tamaño de un significado cuestión.

(Yo aconsejo que la aplicación de una colección de pruebas de normalidad-o de hecho por lo general alguna. Si usted necesita la prueba de normalidad, por alguna razón, elija una de las pruebas que las mejores medidas de cualquier desviación de la normalidad que lo más importante para que usted sea capaz de recoger.)

La muestra es, en el mejor muy ligeramente sesgada a la derecha (tanto las medidas más comunes de lo sugieren muy débil asimetría a la derecha), y tiene un toque de bimodalidad, pero tampoco iba a ser lo suficientemente fuerte como para sugerir que la muestra no es consistente con el hecho de tener provienen de una distribución normal.

Por ejemplo, el tercer momento de asimetría es de sólo 1 error estándar de 0.

Podemos ver la pista de bimodalidad en el Q-Q plot:

qq-plot indicating a gap with only one data value

Las partes izquierda y derecha son casi lineal, pero hay una sección en el medio que se parece a la línea fue "empujado" en ese momento, dejando una brecha con sólo un valor de datos en el mismo, donde normalmente se esperaría varios puntos. Esta es la principal fuente de la sugerencia de bimodalidad que los datos ... pero ver este tipo de cosas con muestras pequeñas.

Así, mientras que usted está observando esas cosas (posible la asimetría y la bimodalidad en la muestra) esas impresiones son muy débiles y no indican que la muestra no podría haber venido de una distribución normal.

Incluso si usted podría decir que la muestra no provienen de una distribución normal (y es casi seguro que no, simplemente porque tales modelos simples son casi nunca se va a describir los datos reales), eso no significa que usted no debe asumir la normalidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X