Se han escrito libros para responder a sus preguntas, ya que éstas abarcan un amplio campo estadístico. Su última pregunta es la más fácil de responder. Basar el tamaño de una muestra en la consecución de una precisión determinada (margen de error o semiamplitud de un intervalo de confianza, etc.) es extremadamente razonable y suele recomendarse en lugar de utilizar los cálculos de potencia de la estadística frecuentista tradicional. Esto también está relacionado con una de sus preguntas anteriores. Usted ha conceptualizado inmediatamente el análisis en términos de prueba de hipótesis, pero no es la única forma de hacerlo. En la estadística frecuentista podrías detenerte en un intervalo de confianza y con la estadística bayesiana en una distribución posterior.
A continuación viene la parte sutil relacionada con tus primeras preguntas. Usted prevé que los datos llegarán "de golpe" y ha adoptado el enfoque típico de hacer un cálculo del tamaño de la muestra para saber cuánto tiempo hay que esperar antes de analizar los datos (hasta que espere que la potencia supere un umbral arbitrario). Los cálculos del tamaño de la muestra son necesarios en algunos casos si se dispone de un presupuesto fijo, y son necesarios cuando se realiza un análisis frecuencial secuencial debido a su necesidad de "gastar ". $\alpha$ "que es la probabilidad de aserción de tipo I. Si utiliza la inferencia bayesiana o likelihoodista, el tamaño de la muestra no es una parte intrínseca del diseño y puede experimentar hasta que haya aprendido lo suficiente y analizar los datos con la frecuencia que desee.
El aprendizaje secuencial sin un tamaño de muestra firme tiene muchas ventajas. Una de las mayores ventajas es que se puede llegar a lo que se esperaba que fuera el tamaño final de la muestra, pero se observa o bien más variabilidad en $Y$ de lo que se había previsto, o se obtiene un resultado equívoco sobre el efecto del tratamiento. Decide que merece la pena aleatorizar unos cuantos sujetos más para ver si puede obtener un resultado más definitivo. Contrasta eso con el diseño rígido que tú (y tantos otros) utilizáis, en el que un resultado muy común es algo así como p=0,1 con el tamaño de muestra objetivo y un gran margen de error, siendo la conclusión "no sabemos nada ahora que no supiéramos antes de hacer el experimento", es decir, sólo sabemos que nos hemos gastado el tiempo y el dinero.
De sus preguntas se desprenden al menos otros tres puntos fundamentales. En primer lugar, en los cálculos de potencia no se utilizan los efectos observados en estudios anteriores. La potencia se calcula basándose en un efecto que no se quiere pasar por alto, no en un efecto observado por otra persona. En segundo lugar, en tu pregunta "imagina que el fármaco se reduce en 0,4", tienes que tener en cuenta que el 0,4 es una estimación puntual con mucha incertidumbre (margen de error distinto de cero). Se puede decir que el fármaco en neto funcionó mejor para los sujetos en su muestra pero no puedes decir que la droga funcionó mejor en general . Por último, pregunta sobre el cambio a una prueba unilateral si su estimación puntual (ruidosa) está en la dirección favorable. Es mejor pensar en esos datos previos al formular el diseño. Pero para $\alpha=0.05$ se puede pensar que esto permite válidamente dos unilaterales $\alpha=0.025$ pruebas. Obsérvese de nuevo que sería útil disponer de un intervalo de incertidumbre en lugar de realizar pruebas de hipótesis. También es muy importante señalar que das por sentado que el paradigma estadístico frecuentista tradicional es el que hay que utilizar. Si utilizara la distribución de probabilidad posterior bayesiana (que puede actualizarse cada vez que se recoge una nueva observación), la mayoría de las probabilidades que calcula ya son direccionales. Por ejemplo, se puede calcular la probabilidad de que el fármaco actúe en la dirección correcta o la probabilidad de que el fármaco actúe mejor que un efecto de 0,2. Con Bayes no hay corrección de multiplicidad porque también se puede preguntar si hay pruebas de que el fármaco funciona en la dirección equivocada.