Esta pregunta está relacionada con la frecuentista propiedades de los valores de p y su relación con el tipo de error y por qué los resultados de una simulación en línea que difieren de lo que yo hubiera esperado.
Supongamos que realizar un experimento y hacer pruebas de hipótesis a un nivel de significación de 0,05. A continuación, calcular el p-valor. Si es menor de 0,05 luego me rechazar la hipótesis nula, si es mayor que 0.05, entonces acepto la hipótesis nula (como por Neyman-Pearson, la prueba de hipótesis). Ahora, si he repetido este experimento cientos de veces (cada vez que aceptar o rechazar la hipótesis nula en 0,05), entonces el error de tipo I (probabilidad de rechazar una verdadera hipótesis nula) debe ser de alrededor de 5% que no es correcto?
Quería poner a prueba mi comprensión de lo que he usado este applet de java: http://www.stat.duke.edu/~berger/applet2/pvalue.html para simular exactamente como un experimento. Yo guardaba todo en su defecto los niveles en el applet, excepto en la barra superior donde he cambiado el rango de valores de p de 0 a 0.05. Esencialmente, esto es lo que me permite rechazar todos aquellos experimentos en los que el valor de p fue < 0.05 y averiguar cuántas H0 fueron incorrectamente rechazado (H0 era realmente cierto) y cuántos H0, se ha rechazado (H1 era realmente cierto).
Yo habría asumido que iba a obtener alrededor de 5% de los verdaderos valores nulos; sin embargo, cuando me encontré, me sale alrededor de 12% H0, y el 88% H1, lo que significa que el 12% de los números que fueron rechazadas verdaderos valores nulos, mientras que el 88% eran falsas, esto es un error de tipo 1 de 12%. Lo que me estoy perdiendo? Por favor alguien puede explicar por qué el applet se acercó con estos resultados?