Si su nivel de confianza es $1-\alpha$ entonces lo más temprano que podrías parar sería si tienes una cadena de cabezas. La longitud mínima ( $N_0$ ) de dicho recorrido se calcula como:
$N_0 = \lceil -\log_{20} \alpha \rceil \approx 1$ (si $\alpha = 0.05$ ) por lo que si obtienes un cara en tu primer lanzamiento, estás acabado - lo que tiene sentido porque sólo hay un 5% de posibilidades de que esto ocurra.
Por comentario de la OP
Las pruebas secuenciales constituyen un amplio campo de la estadística. No existe un método único para determinar cuándo parar. Sin embargo, a continuación se presenta una forma relativamente sencilla de obtener un "horizonte de rechazo" decente. Tenga en cuenta que ahora estamos analizando trayectorias de muestras completas, no resultados individuales. En este caso, estamos haciendo un paseo aleatorio bernoulli, donde los tamaños de paso son 0 y 1.
Lo que hice fue simular 1000 trayectorias de muestra, cada una de 50 lanzamientos de longitud. Luego establecí un "corte" para cada paso de tiempo, $t$ (¡con antelación!) como el $1-k$ percentil de un $bin(t,.05)$ . Hice que Excel determinara cuántas trayectorias de muestra habrían superado el punto de corte en algún momento de los 50 lanzamientos. Quería que este número fuera <50, para que menos del 5% de las trayectorias cruzaran el punto de corte. Esto lo conseguí modificando $k$ (hacia abajo) hasta que tenga menos de 50 trayectorias golpeando la región de rechazo.
Una vez que haya establecido su "horizonte de rechazo" para cada paso de tiempo (de nuevo, con antelación), entonces puede empezar a lanzar hasta que llegue al final de 50 lanzamientos o se encuentre con la barrera. Si llega al final, no rechaza la hipótesis nula, de lo contrario, la rechaza.
He adjuntado una muestra de 250 trayectorias de este tipo junto con el "horizonte de rechazo" derivado en (rojo punteado). Para que veas cómo es esto. Hay mucha literatura por ahí, así que si vas en serio, deberías buscar en las pruebas secuenciales.