Un seminario web el otro día por un a/b testing compañía tenía sus residentes "Científico de Datos", explíquele que debe validar los resultados por volver a ejecutar el experimento. La premisa era que, si selecciona un 95% de confianza, es de 5% (1/20) de probabilidad de un falso positivo. Si vuelve a ejecutar el experimento con las mismas limitaciones, ahora hay un 1/400 (estoy asumiendo que determina este 0,05^2 = 1/400)
Es esta una afirmación válida? (es decir, "ejecutar dos veces, dos significación estadística gana = 1/400 probabilidad de falso positivo")? Hubiera sido un mejor enfoque para aumentar su nivel de significación?
Desde un punto de vista empresarial, la preocupación que tengo es volver a ejecutar el experimento, se están exponiendo a más usuarios a un inferior de la página (tratamiento), y por lo tanto perder el potencial de ventas.