Supongamos que un jugador de la IA en una partida puede ganar o perder. Deseo estimar la proporción de victorias de este jugador. Mi pregunta es, ¿cuántas muestras (partidas) se necesitan para obtener un error inferior al 1%?
Un amigo me explicó que Desigualdad de Hoeffding es el enfoque correcto, sin embargo en una pregunta similar Tamaño de la muestra necesario para estimar la probabilidad de "éxito" en un ensayo Bernoulli la respuesta no mencionaba la desigualdad de Hoeffding. También encontré esto Calculadora del tamaño de la muestra que podría ser la herramienta adecuada para este problema, sin embargo no pude entender cómo utilizarla.
Desigualdad de Hoeffding : Supongamos que quiero saber con un 95% de certeza que la proporción de victorias es X ±1% que,
$$ P(H(n) \leq k) = \sum_{i=0}^k {n\choose i} p^iq^{n-i} $$ Para $ k=(p-\epsilon)n$ , $$ P(H(n) \leq (p-\epsilon)n) \leq e^{-2\epsilon^2n}$$ $$ P(H(n) \geq (p+\epsilon)n) \leq e^{-2\epsilon^2n}$$ Así, $$ (p-\epsilon)n \leq P(H(n) \leq (p+\epsilon)n) \geq 1-2e^{-2\epsilon^2n}$$ Para $ \epsilon = 0.01$ y $ 95\% $ certeza $$ 95\% \geq 1-2e^{-0.0002n}$$ que da $ n\geq 18,444 $
Esto significa que para estimar la proporción de victorias con un error inferior al 1%, en el 95% de las veces, se necesitan 18444 muestras.
¿Es eso cierto? ¿Es la desigualdad de Hoeffding el mejor enfoque en este caso? ¿está apretado? ¿Puede algún otro límite / desigualdad dar esta certeza con menos muestras? ¿Si sé que la proporción de victorias es de 60±5%, eso ayudaría?