5 votos

La teoría de probabilidades en torno a una bolsa de caramelos

Considere una bolsa de caramelos que contiene $N=100$ caramelos. Solo hay dos tipos de caramelos en la bolsa. Digamos el caramelo de caramelo y el caramelo de chocolate. No se sabe nada más sobre el contenido de la bolsa.
Ahora, vas a sacar (aleatoriamente) un caramelo a la vez de la bolsa hasta que aparezca el primer caramelo. Supongamos que el primer caramelo apareció en el $k=7$mo dibujo.

En este momento, ¿qué podemos decir sobre la cantidad de caramelos de caramelo en la bolsa?

5voto

Jeff Fritz Puntos 151

La pregunta que estás haciendo aquí es la pregunta clásica de estadística inferencial: "Dado el resultado de un experimento, ¿qué se puede decir sobre la distribución de probabilidad subyacente?"

Podrías, por ejemplo, dar un estimador para la cantidad desconocida "número de caramelos" (llamado $a$ a partir de aquí). El más usado (ya que es fácil de calcular) sería el estimador de máxima probabilidad, donde estimas $a$ como el valor que maximiza la probabilidad del resultado.

En este caso, elegirías $a$ para maximizar $P_a(7)$ (la probabilidad de sacar el primer caramelo en el séptimo intento, asumiendo que hay $a$ de ellos). Un pequeño cálculo en Excel, junto con la forma de calcular $P_a(7)$ de Isaac, resulta en que $a$ se estime como 14.

Para juzgar el valor de este resultado, necesitarías calcular el error cuadrático medio de este estimador, lo cual no es tan fácil de hacer.

Si ya tenías una hipótesis sobre $a$ (digamos $a$ < 20), podrías usar tu resultado experimental para probarla, utilizando también la prueba de hipótesis estadística.

0 votos

Sí, 14 es la estimación "correcta", ya que debería ser menor que 100/7 como expliqué en mi respuesta (no creo que sea necesario trabajar con las cifras exactas en este caso).

0 votos

@Derek: Mirando mi gráfico de Excel, es una llamada bastante cercana para el estimador de máxima probabilidad entre 13, 14 y 15. Dado que no está garantizado que sea imparcial ni particularmente bueno, no tengo mucha confianza en 14, pero no conozco un estimador mejor (es decir, el mejor imparcial) aquí. =)

0 votos

Yo también desconozco la cifra exacta, por eso puse "correcto" entre comillas, pero debería ser menos de 100/7. Estimé ya que las cifras exactas se hicieron confusas.

1voto

pix0r Puntos 17854

Si el número de caramelos es $a$, entonces la probabilidad de que los primeros 6 caramelos dibujados no sean caramelos y el séptimo dibujado sea un caramelo (asumiendo que no ponemos los caramelos dibujados de nuevo) es $P(\text{7th}|a)=\frac{93!(100-a)(99-a)(98-a)(97-a)(96-a)(95-a)a}{100!}$. Ahora, dado que esto ha ocurrido, la probabilidad $P(a|\text{7th})$ de cualquier valor particular de $a$ dado que el primer caramelo es el séptimo dibujado debería ser $P(\text{7th}|a)$ para ese $a$ particular dividido por la suma de todos los posibles $P(\text{7th}|a)$. $\sum_{a=0}^{100}P(\text{7th}|a)=\frac{101}{56}$, entonces $$P(a|\text{7th})=\frac{P(\text{7th}|a)}{\frac{101}{56}}=\frac{56\cdot 93!(100-a)(99-a)(98-a)(97-a)(96-a)(95-a)a}{101!}.$$

Haciendo algunos cálculos y sumando cosas, la probabilidad de que $a\le 19$ es ligeramente menos del 50% (49.673%) y el valor esperado de $a$ es $\frac{65}{3}=21\frac{2}{3}$.


edit: (He alterado ligeramente mi respuesta original arriba, principalmente en la notación, para adaptarse mejor al trabajo a continuación; creo que el trabajo anterior asumió que, sin saber cuánto tiempo llevó dibujar el primer caramelo, cada posible número de caramelos era igualmente probable.)

Supongamos que $P(a)$ es la probabilidad de que haya $a$ caramelos. Como arriba, para cualquier valor particular de $a$, la probabilidad $P(\text{7th}|a)$ de que el primer caramelo dibujado sea el séptimo caramelo dibujado es $$P(\text{7th}|a)=\frac{93!(100-a)(99-a)(98-a)(97-a)(96-a)(95-a)a}{100!}.$$ Entonces, la probabilidad de que haya $a$ caramelos y que el primer caramelo dibujado sea el séptimo caramelo dibujado es $P(a\text{ and 7th})=P(a)\cdot P(\text{7th}|a)$. Por el Teorema de Bayes: $$\begin{align} P(a|\text{7th})&=\frac{P(a\text{ and 7th})}{P(\text{7th})}=\frac{P(a\text{ and 7th})}{\sum_{k=0}^{100}P(k\text{ and 7th})} \\ &=\frac{P(a)P(\text{7th}|a)}{\sum_{k=0}^{100}P(k)P(\text{7th}|k)} \end{align}$$

Ahora, si $P(a)=\frac{1}{100}$ para todos los $a$, esto produce los resultados de mi respuesta original. Si $P(a)={100 \choose a}\frac{1}{2^{100}}$ (una distribución binomial con caramelos y no igualmente probables para cada caramelo individual cuando la bolsa se llena originalmente), el valor esperado de $a$ es 47.5.

Si $P(a)={100\choose a}p^a(1-p)^{100-a}$ (una distribución binomial donde la probabilidad de que cada caramelo individual sea caramelo es $p$ cuando la bolsa se llena originalmente), el valor esperado de $a$ es $1+93p$. Si este valor esperado de $a$ dado que el primer caramelo dibujado fue el séptimo caramelo dibujado debe ser igual al valor esperado de $a$ sin haber dibujado ningún caramelo, que es $100p$, entonces $p=\frac{1}{7}$, así que el valor esperado de $a$ es $\frac{100}{7}=14\frac{2}{7}$.

0 votos

No creo que sea correcto trabajar con una distribución de probabilidad de $a$. $a$ está fijo en este experimento (es decir, no está sujeto a posibilidades) y debe ser estimado.

0 votos

@Jens: Supongo que podría estar asumiendo que la distribución de valores de $a$ en general es uniforme (y trabajando con probabilidades condicionales a partir de ahí) para llegar a mi conclusión.

0 votos

@Isaac: Deberías mencionar esto en tu respuesta. La suposición de que una cantidad desconocida está distribuida de forma uniforme se hace bastante a menudo, y también está equivocada casi tan a menudo. Por ejemplo, mientras que la respuesta a la pregunta de si hay terriers en un planeta en el sistema de Alfa Centauri es desconocida, la suposición de que sí y no son igualmente probables es... incorrecta. =)

0voto

kevingessner Puntos 351

Dado que 100 es bastante más grande que 7, asumiremos para fines de cálculo que la probabilidad de sacar un caramelo no se ve afectada por el sorteo anterior (por supuesto, se altera un poco, pero no demasiado).

Dejemos que la probabilidad de sacar un caramelo sea $p$ y la probabilidad de sacar un chocolate sea $q$, donde $p+q=1$.

Entonces, el número esperado de intentos para sacar un caramelo es

$$E= p+2pq+3pq^2+4pq^3+ \cdots = \frac{1}{p}.$$

Dado que sacamos un caramelo en el séptimo intento, tenemos $7=1/p$, por lo tanto $p = 1/7.$ Así que aproximadamente $100/7 \approx 14$ de los dulces son caramelos.

Si usáramos las cifras correctas, la probabilidad de sacar un caramelo en el próximo intento aumentaría con cada chocolate sacado, lo que haría que el número estimado de caramelos disminuyera, quizás a 13, pero no espero que cambie mucho ya que empezamos con 100 dulces.

Cuanto menor sea el número del primer intento de sacar un caramelo, menos se puede decir con fiabilidad. Imagina si sacaste un caramelo en el primer intento, eso podría implicar que todos son caramelos, lo cual podría estar completamente equivocado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X