Tengo algunos datos de lo que se ve de trazado de un gráfico de residuales vs tiempo casi normal, pero quiero estar seguro. Cómo puedo hacer la prueba de normalidad de los errores de los residuos?
Respuestas
¿Demasiados anuncios?No existe ninguna prueba le dirá que los residuos están normalmente distribuidos. De hecho, usted puede disfrutar de la apuesta que están no.
-
Las pruebas de hipótesis no son generalmente una buena idea de como se comprueba en sus supuestos. El efecto de la no-normalidad en su inferencia en general no es una función del tamaño de la muestra*, sino el resultado de una significancia de la prueba es. Una pequeña desviación de la normalidad, será obvio en una muestra de gran tamaño, incluso a pesar de que la respuesta a la pregunta de interés real ('żen qué medida este impacto mi inferencia?') puede ser 'casi todo'. En consecuencia, una gran desviación de la normalidad en un tamaño pequeño de la muestra no pueden enfoque de la significación.
* (añadido en la edición) - en realidad, eso es demasiado débil una declaración. El impacto de la no-normalidad en realidad disminuye con el tamaño de la muestra casi cualquier hora de la CLT y del teorema de Slutsky se va a celebrar, mientras que la capacidad para rechazar la normalidad (y, presumiblemente, evitar normal-la teoría de los procedimientos) aumenta con el tamaño de la muestra ... así que cuando usted es más capaz de identificar la no-normalidad tiende a ser cuando no importa de todos modos... y la prueba es que no ayuda cuando lo que realmente importa, en muestras pequeñas.
Lo que viene más cerca a medir el tamaño del efecto es que algunos de diagnóstico (ya sea una pantalla o una estadística) que mide el grado de no-normalidad de alguna manera. Un Q-Q plot es un caso obvio de la pantalla, y un Q-Q plot de la misma población en un tamaño de la muestra y en distintos tamaños de muestras son al menos tanto ruidoso estimaciones de la misma curva , mostrando aproximadamente el mismo "no normalidad"; al menos debería ser aproximadamente monótonamente relacionados con la deseada respuesta a la pregunta de interés.
Si debe utilizar una prueba de Shapiro-Wilk es probablemente tan buena como cualquier otra cosa. (Pero es una respuesta a una pregunta que ya sabes la respuesta - y cada vez que usted no puede rechazar, dando una respuesta puede estar seguro de que está mal.)
El test de Shapiro-Wilk es una posibilidad.
Esta prueba se implementa en casi todos los paquetes de software de estadística. La hipótesis nula es que los residuos están normalmente distribuidos, así que un pequeño p-valor indica que se debe rechazar la nula y concluir que los residuos no están distribuidos normalmente.
Tenga en cuenta que si el tamaño de la muestra es grande, es casi siempre rechazan, por lo que la visualización de los residuos es más importante.
De la wikipedia:
Pruebas de normalidad univariante incluyen D'Agostino K-cuadrado de la prueba, el de Jarque–Bera prueba, la de Anderson–Darling prueba, el Cramér–von Mises criterio, la prueba de Lilliefors para la normalidad (en sí misma una adaptación de la prueba de Kolmogorov–Smirnov), el test de Shapiro–Wilk, el de Pearson, prueba de chi-cuadrado, y el de Shapiro–Francia de la prueba. En 2011 el papel de La Revista de Modelado Estadístico y análisis [1] concluye que la de Shapiro-Wilk tiene la mejor energía para un determinado significado, seguido de cerca por la de Anderson-Darling, al comparar la de Shapiro-Wilk, test de Kolmogorov-Smirnov, Lilliefors, y Anderson-Darling pruebas.