Actualmente estoy buscando una prueba que tenga por hipótesis nula que la muestra hace no provienen de la observación de una variable aleatoria con distribución normal. En otras palabras, me gustaría saber si hay una prueba opuesta a la K-S, Anderson-Darling, Shapiro-Wilk o Jarque-Bera.
Respuestas
¿Demasiados anuncios?Creo que la cuestión es la misma tanto si la normalidad es la hipótesis nula como la alternativa. la prueba es una medida de la bondad del ajuste. Si la prueba se basa en el enfoque tradicional, se busca el tamaño de la estadística de la prueba para rechazar la normalidad. Si la normalidad es la alternativa, entonces se pregunta qué tamaño debe tener el estadístico para decir que la distribución se aproxima lo suficiente a la normalidad.
No lo he visto hacer, pero es muy parecido a las pruebas de equivalencia que se hacen mucho en la industria farmacéutica. En las pruebas de equivalencia se quiere demostrar que el medicamento tiene un rendimiento similar al de la competencia. Esto se hace a menudo cuando se intenta encontrar un sustituto genérico para un medicamento comercializado. Se define una pequeña distancia desde 0 que se denomina ventana de equivalencia y se rechaza la hipótesis nula cuando se tiene una alta confianza en que la verdadera diferencia media en la medida de rendimiento está dentro de la ventana de equivalencia. El método está bien definido en el artículo de Bill Blackwelder "Proving the Null Hypothesis". La estadística de la prueba es la misma o similar, sólo que se ejecuta de forma diferente. Por ejemplo, en lugar de utilizar una prueba t de dos colas para demostrar que la diferencia media es diferente de 0, se realizan dos pruebas t unilaterales en las que es necesario rechazar ambas para afirmar la equivalencia. El tamaño de la muestra se determina de forma que la potencia de rechazo de la no equivalencia cuando la diferencia media real es menor que un valor pequeño especificado.
Creo que una prueba para rechazar la no normalidad podría plantearse de la misma manera.
Creo que el problema no está bien definido. Usted quiere demostrar que los datos "no provienen de una distribución normal". Eso es fácil, ¡acepte! NINGÚN dato "procede de una distribución normal", la distribución normal es, en el mejor de los casos, una aproximación.
Pero, por supuesto, podría tener pruebas de bondad de ajuste para otras distribuciones, por ejemplo la de Poisson. No sé si hay mucho publicado, pero lo que se puede hacer, es hacer un qq-plot para la distribución elegida. Para el caso de Poisson, lo que puedes hacer es (código R):
dat <- rpois(200,10)
p <- qpois(ppoints(200), 10)
qqplot(p,dat)
y una estadística de prueba podría ser la correlación en el qqplot: cor(p,sort(dat))
Ahora puedes encontrar la distribución nula de esta estadística por simulación:
cors <- vector(mode="numeric", length=1000)
for (i in 1:1000) {
cors[i] <- cor(qpois(ppoints(200), 10), sort(rpois(200, 10))
}
hist(cors)
En la práctica, es de suponer que estimará la media de Poisson, por lo que deberá rehacer la simulación incorporando la estimación de la media. ¡También es probable que quiera aumentar el número de muestras simuladas de 1000!
La simulación que incorpora la estimación de la media podría ser:
NSIM <- 1000
SAMPSIZE <- 200
MEAN <- 10
cors <- vector(mode="numeric", length=NSIM)
for (i in 1:NSIM) {
samp <- rpois(SAMPSIZE, MEAN)
m <- mean(samp)
cors[i] <- cor(qpois(ppoints(SAMPSIZE), m), sort(samp))
}
hist(cors)
La respuesta es Chi cuadrado Prueba de bondad de ajuste para una distribución normal
Aquí puede ver el ejemplo http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm