Hay que adivinar cuál va a ser la nueva tasa de fracaso (tal vez basándose en un estudio piloto) y luego calcular la probabilidad de error de tipo II.
Existen fórmulas para ello pero a veces me resulta más fácil y convincente simular los resultados. Aquí hay un poco de código R descuidado que utilizará simulaciones para estimar la potencia. (El enlace es para una prueba t pareada, y he simulado una prueba t de dos muestras, por lo que tendría que ajustar uno de estos para que sean equivalentes).
#Compare the failure rates of two random samples
fail <- function(n,p) rbinom(n,1,p)
#It would be good to change t.test to a more powerful test (and see how that affects power).
compare <- function (n,p.old=1/20,p.new=1/10) t.test(fail(n,p.old),fail(n,p.new))$p.value
#Use 50 simulations. Increase this for higher precision
simulations<-50
#Parametrize sample size
samplesize<-seq(50,1000,10)
#What's the 95%ile p-value of the simulations
q95_p.value<-function(samplesize) quantile(replicate(simulations,compare(samplesize)),0.95)
#Plot the p-values
plot(samplesize,sapply(samplesize,q95_p.value),ylim=0:1,ylab='95%ile simulated p-value')
#If the 95%ile p-value for the sample size is below the line, then power is probably above 95%
abline(h=0.05)
Este es el gráfico resultante suponiendo que la tasa de fallos antigua sea $\frac{1}{20}$ y el nuevo $\frac{1}{10}$ . Si el valor p del 95% del tamaño de la muestra está por debajo de la línea, la potencia es probablemente superior al 95%.
Probablemente haya un paquete R que lo haga mejor.
Y debo decir que esos tamaños de muestra parecen terriblemente grandes. Tal vez cometí un error en alguna parte.
0 votos
Esta cuestión me sigue preocupando y no me satisfacen las dos respuestas dadas. Mis disculpas a Greg y Thomas. No sé si esto es correcto, pero he experimentado con el simple cálculo de la distribución binomial.
0 votos
Oops - se me pasó la fecha límite de edición... ¡No sé si esto es correcto, pero he experimentado con el simple cálculo de la distribución binomial - es decir, (n! / ((n-k)! k!)) p^k (1-p)^(n-k) donde n = número de ensayos, k = número de fallos, p = probabilidad de fallo. En mi problema actual, el código defectuoso me dio 3 fallos en 9 intentos - supongamos que esto implica una probabilidad de 1/3. La probabilidad de 0 fallos en 9 es del 2,6%; mejor aún, 0 fallos en 15 intentos es del 0,23%. Eso me da una idea.