La siguiente pregunta proviene de la sección de probabilidad del Prueba del Titán *.
* Evitaré el debate sobre si esta prueba mide con precisión lo que pretende, ni si tales objetivos son significativos. La prueba parece contener algunos rompecabezas matemáticos interesantes, ¡y eso es lo que cuenta!
Supongamos que eres la verdad es que se le dijo que se introducían diez canicas en una caja, todas ellas idénticas excepto que sus colores se determinaban al lanzar una moneda imparcial. Cuando salía cara, se introducía una canica blanca, y cuando salía cruz, una negra. Se mete la mano en la caja, se saca una canica, se inspecciona su color y luego devolverlo a la caja . Agita la caja para mezclar las canicas al azar, y luego mete la mano y vuelve a seleccionar una canica al azar . Si inspeccionas diez canicas sucesivamente de esta manera y todas resultan ser blancas, ¿cuál es la probabilidad [probabilidad], con el porcentaje entero más cercano, de que las diez canicas de la caja sean blancas?
No estoy seguro de cómo abordar esta cuestión en el marco de la probabilidad frecuentista. Parece que se justifica un enfoque bayesiano.
El punto de partida crucial es: ¿qué distribución a priori debe utilizarse?
Mi primer instinto sería basar el anterior en un distribución binomial ya que se nos dice que la caja se llenó a través de un proceso de Bernoulli. Artículos como http://www.amstat.org/publications/jse/v12n2/zhu.pdf abordar aquellos casos en los que "no existe una opinión previa sólida sobre lo que es p", esto no parece aplicarse aquí.
Así que define
$b_n = {\displaystyle{\binom{10}{n}}}\dfrac{1}{2^{10}} \tag{1}$
para la distribución previa de las canicas negras.
Déjalo:
- $n$ sea el número de canicas negras en la caja
- $A_{0}$ sea el caso de que se extraigan 10 canicas blancas
- $A_{0,n}$ sea el caso de que se extraigan 10 canicas blancas y la caja contenga $n$ canicas negras
- $B_n$ sea el evento previo que contenía la caja $n$ canicas negras
Entonces
$P(A_0) = \sum\limits_{n=0}^{10}{P(A_{0,n})} \tag{2}$
y por el Teorema de Bayes
$P(A_{0,n}) = P(A_0 \cap B_n) = P(B_n)P(A_0|B_n) \tag{3}$
donde
$P(B_n) = b_n = {\displaystyle{\binom{10}{n}}}\dfrac{1}{2^{10}} \tag{4}$ y $P(A_0|B_n) = \Big(1-\dfrac{n}{10}\Big)^{10} \tag{5}$
La respuesta que buscamos es $\dfrac{P(A_{0,0})}{P(A_{0})}$ . Esto puede calcularse utilizando (2) a (5).
¿Parece correcto el planteamiento?
Si es así, ¿cómo podría deshacerme de la desagradable normalización en el último paso? Fíjate en que no he afirmado (ni podría hacerlo) que $p(A_0) = 1$ .