Antes de iniciar una prueba a/b con una ruta de control y otra experimental, puedo calcular el tamaño de la muestra necesario basándome en las estimaciones de la tasa de conversión de ambas rutas. Puedo obtener una buena estimación de la tasa de conversión del control consultando los datos históricos. Pero el índice de conversión de la ruta experimental es desconocido. Lo que quiero hacer es calcular una serie de tamaños de muestra diferentes basados en una variedad de sensibilidades.
Por ejemplo, puedo calcular el tamaño de las muestras para una sensibilidad del 10%, 15% y 20% (aumento de la conversión con respecto al control) que podría ser así:
Sensitivity Required Sample Size
10% 1,961
15% 871
20% 490
Algunos de los leyendo He hecho dice que se debe calcular un tamaño de muestra único al inicio de la prueba y siempre ejecutar la prueba durante ese tiempo.
Pregunta:
- ¿Hay algún problema con la comprobación de la significación estadística en múltiples tamaños de muestra precalculados y con la posibilidad de terminar una prueba antes de tiempo si he encontrado que los resultados son estadísticamente significativos?
Ejemplo:
En principio, estimo que la ruta experimental superará a la de control en un 15%. Pero una vez que he llegado a las 490 muestras descubro que la ruta experimental supera al control en un 20%, ¿puedo terminar la prueba y declarar que la ruta experimental aumenta la conversión en un 20%?