Digamos que quiero saber qué tamaño de muestra necesito para un experimento en el que busco determinar si la diferencia entre dos proporciones de éxito es estadísticamente significativa o no. Este es mi proceso actual:
-
Examinar los datos históricos para establecer predicciones de referencia. Digamos que, en el pasado, tomar una acción da como resultado una tasa de éxito del 10%, mientras que no tomarla da como resultado una tasa de éxito del 9%. Supongamos que estas conclusiones no han sido validadas estadísticamente, pero que se basan en cantidades relativamente grandes de datos (más de 10.000 observaciones).
-
Introduce estas suposiciones en power.prop.test para obtener lo siguiente:
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
-
Así que esto me dice que necesitaría un tamaño de muestra de ~20000 en cada grupo de una prueba A/B para detectar una diferencia significativa entre las proporciones.
-
El siguiente paso es realizar el experimento con 20.000 observaciones en cada grupo. El grupo B (sin acción) tiene 2.300 aciertos de 20.000 observaciones, mientras que el grupo A (con acción) tiene 2.200 aciertos de 20.000 observaciones.
-
Haz un prop.test
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
-
Por tanto, decimos que podemos rechazar la hipótesis nula de que las proporciones son iguales.
Preguntas
- ¿Es este un método adecuado o, al menos, va por el buen camino?
- ¿Podría especificar
alt="greater"
en prop.test y confiar en el valor p a pesar de que power.prop.test era para una prueba de dos caras? - ¿Qué pasa si el valor p es superior a 0,05 en la prueba prop. ¿Debo asumir que tengo una muestra estadísticamente significativa pero que no hay una diferencia estadísticamente significativa entre las dos proporciones? Además, ¿es la significación estadística inherente al valor p en prop.test - es decir, es necesario el power.prop.test?
- ¿Qué pasa si no puedo hacer un reparto 50/50 y necesito hacer, por ejemplo, un reparto 95/5? ¿Existe algún método para calcular el tamaño de la muestra en este caso?
- ¿Y si no tengo ni idea de cuál debe ser mi predicción de base para las proporciones? Si adivino y las proporciones reales están muy lejos, ¿invalidaré mi análisis?
Cualquier otra laguna que pudierais rellenar sería muy apreciada - mis disculpas por lo enrevesado de este post. Gracias.