17 votos

La distribución no uniforme de los valores de p cuando se simula la binomial pruebas bajo la hipótesis nula

He oído que bajo la hipótesis nula de que el valor p de la distribución debe ser uniforme. Sin embargo, las simulaciones de prueba binomial en MATLAB volver muy diferente-de-distribuciones uniformes, con una media de más de 0.5 (0.518 en este caso): enter image description here

coin = [0 1];
success_vec = nan(20000,1);

for i = 1:20000
    success = 0;
    for j = 1:200
        success = success + coin(randperm(2,1));
    end
    success_vec(i) = success;
end

    p_vec = binocdf(success_vec,200,0.5);
    hist(p_vec);

Tratando de cambiar la manera en la que puedo generar números aleatorios no ayuda. Realmente agradecería cualquier explicación aquí.

21voto

AdamSane Puntos 1825

El resultado que $p$ valores tienen una distribución uniforme en $H_0$ mantiene para la distribución continua de la estadística de prueba - al menos para el punto nulos, como la que tenemos aquí.

Como James Stanley menciona en los comentarios de la distribución de la estadística de prueba es discreto, por lo que el resultado no se aplica. Usted puede no tener errores en su código (aunque yo no mostrar una distribución discreta con un histograma, me iba a inclinarse hacia la visualización de la cdf o la fuerza, o mejor, ambas).

Mientras que en realidad no uniforme, cada salto en la cdf de la p-valor se lo lleva a la línea de $F(x)=x$ (no sé el nombre de este, pero debería tener un nombre, tal vez algo como "cuasi-uniforme"):

enter image description here

Es muy posible calcular esta distribución exactamente, en lugar de simular, pero he seguido su ejemplo y hacer una simulación (a pesar de que uno grande que tiene).

Tal distribución no tiene por qué haber media de 0.5, aunque como el $n$ en el binomio aumenta el paso de cdf se acercan a la línea más de cerca, y la media de la aproximación de 0.5.

Una de las implicaciones de la distinción de los valores de p es que sólo ciertos niveles de significación son alcanzables -- las que correspondan al paso alturas en la población real de cdf de los valores de p en la anulación. Así, por ejemplo, usted puede tener un $\alpha$ cerca de 0.056 o cerca de 0.04, pero no nada más a 0.05.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X