Decir que tengo una muy sesgada de la moneda que cae de cabeza con $p_h=0.01$ y colas con $p_t=0.99$, y le doy la vuelta se $98$ veces.
La probabilidad de cero cabezas es ${p_t}^{98} \approx 0.373$.
La probabilidad de que una cabeza es $98 \times {p_t}^{97} \times p_h \approx 0.370$ como cualquiera de los 98 coin flips podría haber dado H.
La probabilidad disminuye para un mayor número de cabezas.
El número esperado de caras es $\Sigma xp_{xH} = 0.98$ donde $p_{xh}$ es la probabilidad de obtener los $x$ cabezas (esto también es de curso $p_h \times 98$).
Pero el número esperado de cabezas parece ser diferente para el número más probable de los jefes. ¿Cómo podemos dar cuenta de esto?
La respuesta es que si tuviera que apostar sobre cómo muchas cabezas que habría de venir en una sola 98-flip experimento, debo colocar mi apuesta en cero, pero si tuviera que apostar en el largo plazo promedio de muchos 98-flip experimentos que debo apostar 0.98?