Hay una forma de aproximar la respuesta utilizando la teoría de la información. Dejemos que $X$ sea la variable que representa el lado, y que $D$ ser el resultado de una tirada. Cada tirada te dice que mucha información sobre $X$ : $$ I(X;D) = H(D) - H(D|X) = \log 96 + 95 \cdot 0.01 \log 0.01 + 0.05 \log 0.05. $$ Como aproximación, la información obtenida de las diferentes tiradas es aditiva; ciertamente, como mucho es aditiva. Dado que $H(X) = \log 96$ (ya que no tiene ninguna creencia a priori sobre $X$ ), el número de rollos necesarios es al menos $$ \frac{H(X)}{I(X;D)} \approx 115. $$
Otra forma de enfocar la misma cuestión es la siguiente. Supongamos que se lanza el dado $N$ tiempos. El lado bueno surgió aproximadamente $N/20$ veces, y todos los demás subieron $\mathrm{Bin}(N,0.01) \approx \mathcal{N}(0.01N,0.0099N)$ . Así que queremos que la probabilidad de que dicha variable normal sea mayor que $N/20$ sea menor que $1/95$ (ya que hay $95$ tales variables; estamos ignorando su dependencia). Esto es $$\frac{0.05N - 0.01N}{\sqrt{0.0099N}} \approx 0.4\sqrt{N}$$ desviaciones estándar. Mirando una tabla, necesitamos aproximadamente $2.3$ desviaciones estándar para obtener una probabilidad de $1/95$ , por lo que necesitamos $$N \approx (2.3/0.4)^2 = 33. $$ Por supuesto, esta estimación es bastante aproximada (ni siquiera coincide con nuestro supuesto límite inferior anterior).
La estimación del párrafo anterior es particularmente problemática ya que en este rango la convergencia a la distribución normal es bastante mala (la expectativa es muy pequeña, aproximadamente $1$ ). En este régimen, la probabilidad es en realidad aproximadamente poissoniana. Estimemos la probabilidad de éxito cuando $N=100$ utilizando esta aproximación. El lado correcto va a aparecer aproximadamente $5$ tiempos. Cada lado va a aparecer $P(1)$ veces, por lo que va a ser tan grande como $4$ con probabilidad $$ 1 - e^{-1} \sum_{t=0}^4 \frac{1^t}{t!} \approx 0.00366. $$ Así que el número esperado de "contendientes" es $$ 0.00366 \cdot 95 \approx 0.35.$$ Asumiendo la independencia, la probabilidad de que no haya contendientes es aproximadamente $$ (1 - 0.00366)^{95} \approx 0.706. $$ Esta aproximación sólo se ve reivindicada a grandes rasgos por los experimentos que se realizan a continuación.
Para encontrar una mejor aproximación, vamos a tener en cuenta el $P(5)$ distribución del histograma de $X$ : $$ e^{-5} \sum_{H=0}^\infty \frac{5^H}{H!} \left(e^{-1} \sum_{t=0}^{H-1} \frac{1}{t!} \right)^{95} \approx 0.527. $$ Esto se ajusta mucho mejor a los resultados que aparecen a continuación.
Por último, aquí están los resultados experimentales de un millón de ensayos, junto con la aproximación de Poisson:
$$ \begin{array}{r|c|c} N & \text{Experiment} & \text{Approx} \\\hline 50 & 0.272323 & 0.274900 \\ 100 & 0.526765 & 0.527424 \\ 150 & 0.718004 & 0.714956 \\ 200 & 0.840143 & 0.836808 \\ 250 & 0.912917 & 0.910115 \\ 300 & 0.954097 & 0.951953 \end{array}$$
Los resultados apoyan el límite teórico de la información, así como nuestras estimaciones obtenidas utilizando la aproximación de Poisson.
Nota: Cuando la probabilidad de éxito es $p$ y hay $T$ ensayos, la desviación estándar es $$\sqrt{\frac{p(1-p)}{T}} \leq \frac{1}{2\sqrt{T}}.$$ En nuestro caso, $T = 10^6$ y por lo tanto una desviación estándar es como máximo $0.5\cdot 10^{-3}$ . Con probabilidad $95\%$ el error es como máximo de dos desviaciones estándar, es decir $\pm 0.001$ . Por tanto, los resultados experimentales son correctos hasta aproximadamente el tercer dígito (que puede estar ligeramente desviado).