15 votos

Mi distribución es normal; Prueba de Kolmogorov-Smirnov no ' t de acuerdo

Tengo un problema con la normalidad de algunos datos que tengo: He hecho un test de Kolmogorov que dice que no es normal con p=.0000, No entiendo: la asimetría de mi distribución =-.497, y la curtosis =-0,024

Aquí es la trama de mi distribución que parece muy normal ...

(Tengo tres calificaciones, y cada uno de estos puntajes no es normal con un significativo valor de p para el test de Kolmogorov ... realmente no entiendo )

enter image description here

enter image description here

39voto

AdamSane Puntos 1825
  1. Usted no tiene ninguna base para afirmar que sus datos son normales. Incluso si su asimetría y exceso de curtosis ambos eran exactamente 0, lo que no implica que los datos son normales. Mientras que la asimetría y la curtosis lejos de los valores esperados indican la no-normalidad, a la inversa no tiene. Hay distribuciones no normales, que tienen la misma asimetría y la curtosis de la normal. Un ejemplo que se discute aquí, la densidad de la cual se reproduce a continuación:
    dgam 2.3

    Como se puede ver, es claramente bimodal. En este caso, la distribución es simétrica, así como el tiempo suficiente momentos existen, la típica asimetría medida será 0 (de hecho, de todas las medidas habituales). Para la curtosis, la contribución a la 4ta momentos de la región cerca de la media tienden a hacer que la curtosis menor, pero la cola es relativamente pesado, que tiende a hacerla más grande. Si elige la correcta, la curtosis sale con el mismo valor que para el normal.

  2. Su ejemplo de la asimetría es en realidad alrededor de -0.5, que es sugestivo de suave izquierda-asimetría. Su histograma y Q-Q plot indican el mismo ligeramente a la izquierda-sesgo de la distribución. (Leve asimetría es poco probable que sea un problema para la mayoría de las normales comunes-la teoría de los procedimientos.)

  3. Usted está mirando a través de diferentes indicadores de la no-normalidad que usted no debe esperar a un acuerdo a priori, ya que consideran diferentes aspectos de la distribución; con pequeñas ligeramente no muestras normales, que con frecuencia va a estar en desacuerdo.


Ahora la gran pregunta: *¿por Qué las pruebas de normalidad?*

[editado en respuesta de comentario:]

No estoy muy seguro , yo, aunque yo antes de hacer un ANOVA

Muchos puntos a considerar aquí.

yo. La normalidad es una suposición de ANOVA si la vas a usar para la inferencia (tales como pruebas de hipótesis), pero no es especialmente sensible a la no-normalidad en muestras más grandes - leve la no-normalidad es de poca consecuencia y como muestra aumento de tamaño de la distribución puede ser más de no-normal y la prueba puede ser sólo un poco afectados.

ii. Usted parece ser la prueba de normalidad de la respuesta (DV). El (incondicional) de distribución de DV en sí no se considera normal en el ANOVA. Compruebe los residuos para evaluar la razonabilidad de las hipótesis acerca de la distribución condicional (es decir, el término de error en el modelo que se supone normal) - es decir, que no parecen estar buscando en lo correcto. De hecho, debido a que la comprobación se realiza en los residuos, después de ajuste del modelo, en lugar de antes.

iii. Las pruebas formales pueden ser completamente inútiles. La pregunta de interés aquí es " lo mal que está el grado de no-normalidad afectando a mi inferencia?', que la prueba de hipótesis realmente no responde. Como el tamaño de la muestra se hace más grande, la prueba se vuelve más y más capaz de detectar diferencias trivial de la normalidad, mientras que el efecto sobre la inferencia en el ANOVA se vuelve más y más pequeña. Es decir, si el tamaño de la muestra es razonablemente grande, la prueba de normalidad es en su mayoría de decirle a usted que usted tiene una muestra de gran tamaño, lo que significa que no tienen mucho de qué preocuparse. Al menos con un Q-Q plot tiene una evaluación visual de cómo no-normal es.

iv. en un periodo razonable de los tamaños de muestra, otro de los supuestos - como la igualdad de la varianza y de la independencia - en general, importa mucho más que leve la no-normalidad. Preocuparse por los otros supuestos de primera ... pero de nuevo, las pruebas formales no es responder a la pregunta correcta

v. escoger si desea hacer un ANOVA o alguna otra prueba sobre la base del resultado de una prueba de hipótesis tiende a tener peor propiedades que la simple decisión de actuar como si la suposición no tiene. (Hay una variedad de métodos que son adecuados para el ANOVA de una vía-como en los análisis de datos que no se supone que para ser normal que puede utilizar cuando usted no piensa que usted tiene razón para asumir la normalidad. Algunos tienen muy buena potencia a la normal, y con software decente, no hay razón para evitarlos.)

[Creo que tenía una referencia para este último punto, pero no puedo encontrar ahora mismo; si me parece que voy a tratar de volver y poner en]

11voto

mattsmith321 Puntos 1729

El test de Kolmogorov-Smirnov tiene un poco justo de potencia cuando los tamaños de las muestras son grandes, por lo que puede ser fácil para rechazar la hipótesis nula de que los datos no difieren de la normalidad. En otras palabras, la prueba de que a veces sugieren que la distribución no es normal en muestras grandes, incluso si es normal para la mayoría de las intenciones.

Piensa que es como un t-test. Si usted tiene dos poblaciones que difieren en altura por sólo una milésima parte de un milímetro, un increíblemente grandes muestras estadísticamente apoyo que estos son diferentes, incluso si la diferencia es insignificante.

Tal vez usted puede confiar en otros métodos para determinar la normalidad de los datos. Las parcelas que uso son dos buenos ejemplos, así como la inclinación/aplanamiento de los valores.

Este otro tema parece particularmente relacionados: Es la normalidad de las pruebas "prácticamente inútil"?

10voto

jasonmray Puntos 1303

La prueba de Kolmogorov – Smirnov es libre de distribución cuando la hipótesis nula se especifica completamente, si se calculan la media y la varianza de los datos Asegúrese de utilizar la variante de Lilliefors pruebas de normalidad (si es necesario). No es para negar las otras respuestas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X