7 votos

En el problema del coleccionista de cupones con sorteos en grupo, ¿por qué disminuye la probabilidad al aumentar las muestras?

Mi hijo está coleccionando cromos de Panini de uno de sus álbumes de fútbol, donde hay 472 cromos en total, y los puedes comprar en paquetes de 5 (no hay duplicados dentro de esos 5). También puedes comprar a Panini 50 cromos cualesquiera de una sola vez, lo que obviamente querrás hacer justo al final, para los 50 últimos.

Creo que este es el problema de los coleccionistas de cupones que sortean varios cupones a la vez. Un artículo analiza este problema y demuestra una distribución de probabilidad para él. El documento es:

" El problema del coleccionista con los dibujos de grupo ", Wolfgang Stadje, Advances in Applied Probability, Vol 22, No 4, Dic 1990. (Desgraciadamente, no es de libre acceso).

Del periódico, $S$ es el conjunto de todos los adhesivos, $A$ es el conjunto de interés (donde $A\subset S$ ), $l = |A|$ , $s = |S|$ y extraemos, con reemplazo, subconjuntos $\omega_1, \omega_2, \ldots$ de $S$ cada uno de los cuales contiene $m$ diferentes pegatinas. Cada $\omega \subset S$ tiene la misma probabilidad de ser elegido. Entonces $X_k(A)$ es el número de elementos distintos de $A$ contenidas en los conjuntos $\omega_1, \ldots, \omega_k$ y tenemos la siguiente distribución de probabilidad:

$$ P(X_k(A) = n) = {l \choose n}\sum_{j=0}^n (-1)^j {n \choose j} \left[{s + n - l - j \choose m} \bigg/ {s \choose m}\right]^k \quad\quad n = 0, 1, \ldots, l $$

En mi caso, $s=472$ , $l=n=422$ y $m=5$ . Observo cómo cambia la distribución a medida que se compran más paquetes de cromos. Sin embargo, la probabilidad no aumenta monotónicamente a medida que $k$ lo hace.

Es más claro de ver (y trabajar) con valores más pequeños, por lo que para $s=l=3$ , $n=2$ , $m=1$ las probabilidades son 0, 2/3, 2/3, 14/27, 10/27 para $k=1,\ldots,5$ . Alguien puede decirme qué estoy haciendo o interpretando mal aquí, o por qué la probabilidad disminuye con más paquetes, cuando intuitivamente debería tender a 1.

Como referencia, está otro puesto He encontrado que también se ocupa de esta ecuación, pero en el que están considerando $s=l=n$ lo que no ocurre en este caso.

1voto

Robert Mason Puntos 51

Aunque llego tarde al juego, creo que entiendo el problema que tiene. El caso no se debe, como sugieren los comentarios, a que la ecuación sea exactamente para el número de cromos, sino más bien a la naturaleza de tu ejemplo concreto, en el que $n < l$ .

Si releemos el artículo de Wolfgang Stadie del que se extrae esta ecuación, $X_k (A)$ se define como, "el número de elementos distintos de A que están contenidos en al menos uno de los (paquetes dibujados)".

Así que cuando $n$ (el número de pegatinas distintas que queremos) es igual a $l$ (el número total de cromos disponibles), la ecuación se comportará exactamente como esperas. Como $k$ (el número de paquetes que compramos) aumenta, las posibilidades de completar el juego se dirigen hacia $1$ .

Sin embargo, en su caso $l=3$ y $n=2$ . Esto significa que hay tres cromos distintos en todo el conjunto, y se busca la probabilidad de obtener 2 de ellos ( $P(X_k (A) = 2$ ).

Como tal, por supuesto esperaría que su probabilidad tendiera a $0$ como $k$ aumentos. Con cada paquete que compras, aumentan las probabilidades de sacar esa tercera pegatina, que completaría tu serie e invalidaría el resultado que buscabas.

Los resultados que has proporcionado muestran que tus probabilidades de tener sólo dos de los tres cromos del juego son mejores después de comprar sólo uno o dos paquetes de cromos, donde tu probabilidad es $2/3$ . Después de eso su probabilidad tenderá a $0$ . Espero que te sirva de ayuda, aunque sea con dos años de retraso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X