Histogramas - especialmente aquellas con pocas papeleras - a veces puede ser muy engañoso (Ver aquí para algunos de abrir los ojos de los ejemplos).
De hecho, esto es parte de lo que está pasando aquí-cambiando de 4 a 6 cubos, o incluso donde el primer bin comienza parece tener algunos efectos importantes en la impresión generada por el histograma. Una cosa a tener en cuenta es que el número de valores en cada bin aquí son muy pequeños, así que un poco de incertidumbre se adhiere a las impresiones que recibe.
Por ejemplo, con sus datos, y el uso de 4 contenedores así como su primer argumento, un simple cambio de bin-origen produce muy diferentes impresiones (en lugar de mover las bandejas, me mudé a los datos, pero la apariencia de la trama es la misma como el movimiento de los cubos de basura de la otra dirección):
Por otro lado, no hay suficientes puntos de datos a utilizar una gran cantidad de contenedores, así que no hay mucho que hacer al respecto. Me gustaría sugerir el uso de alrededor de 8 bandejas y tratando de obtener más de una bandeja de origen.
¿Qué tenemos aquí?
En primer lugar, la muestra es casi seguro que no, en realidad extraída de una población normal. La normalidad es un modelo, que a menudo puede ser útil, pero es improbable que en realidad describe la población.
Sin embargo, la muestra es bastante consistente con el hecho de ser extraída de una distribución normal - no se puede discernir la no-normalidad el uso de los tests aplicados. Incluso si no se puede, esto no indica que no se debe utilizar la normalidad como un modelo. Esa decisión es más como un efecto-problema de tamaño de un significado cuestión.
(Yo aconsejo que la aplicación de una colección de pruebas de normalidad-o de hecho por lo general alguna. Si usted necesita la prueba de normalidad, por alguna razón, elija una de las pruebas que las mejores medidas de cualquier desviación de la normalidad que lo más importante para que usted sea capaz de recoger.)
La muestra es, en el mejor muy ligeramente sesgada a la derecha (tanto las medidas más comunes de lo sugieren muy débil asimetría a la derecha), y tiene un toque de bimodalidad, pero tampoco iba a ser lo suficientemente fuerte como para sugerir que la muestra no es consistente con el hecho de tener provienen de una distribución normal.
Por ejemplo, el tercer momento de asimetría es de sólo 1 error estándar de 0.
Podemos ver la pista de bimodalidad en el Q-Q plot:
Las partes izquierda y derecha son casi lineal, pero hay una sección en el medio que se parece a la línea fue "empujado" en ese momento, dejando una brecha con sólo un valor de datos en el mismo, donde normalmente se esperaría varios puntos. Esta es la principal fuente de la sugerencia de bimodalidad que los datos ... pero ver este tipo de cosas con muestras pequeñas.
Así, mientras que usted está observando esas cosas (posible la asimetría y la bimodalidad en la muestra) esas impresiones son muy débiles y no indican que la muestra no podría haber venido de una distribución normal.
Incluso si usted podría decir que la muestra no provienen de una distribución normal (y es casi seguro que no, simplemente porque tales modelos simples son casi nunca se va a describir los datos reales), eso no significa que usted no debe asumir la normalidad.