5 votos

Paradoja del cumpleaños combinatoric

Es probable que una forma cerrada solución para este problema, pero se me había desconcertado por días. Esto se trata de una variante de la clásica paradoja de cumpleaños. En resumen, la paradoja de cumpleaños es donde se da sólo 23 de los estudiantes de la probabilidad de que las dos tengan el mismo cumpleaños es > 0.5.

La variante es esta: Si cada estudiante tiene dos (o K) días especiales, ¿cuál es la probabilidad de que dado N los estudiantes cada estudiante tiene por lo menos un día especial que es única para ellos.

Me topé con este problema, mientras que trabajando en un algoritmo criptográfico.

Otra forma de expresar esto en términos de una lotería: Si un sorteo de la lotería consta de 5 números al azar (con repetición) elaborado a partir de un conjunto de 100 números, después de N dibujos ¿cuál es la probabilidad de que cada dibujo tenido al menos un número único entre 5.

Explícitamente, dado que estas variables:

$C = $ el tamaño del conjunto de opciones (por ejemplo, 100 para la lotería o 365 para los días especiales)

$K = $ # de elecciones aleatorias para cada evento (por ejemplo, 5 de la lotería, 2 para los días especiales)

$N = $ # de eventos que han tenido lugar (por ejemplo, los sorteos de lotería, o el número de estudiantes)

Aquí es lo que estoy tratando de resolver para:

$P(C, K, N) = $ la probabilidad de que después de N eventos, donde cada uno de los sorteos de K elementos aleatorios a partir de un conjunto de C elementos, cada evento tiene al menos un elemento que no fue elegido en cualquier otro caso.

Tenga en cuenta que $P(C, 1, N)$ proporciona la solución a la clásica paradoja de cumpleaños.

Para ser claros, la repetición es permitido. Es decir, un estudiante podría tener en el mismo día dos veces, o el sorteo de la lotería podría ser (5, 5, 78, 10, 5). En ese caso, si al menos uno de esos números nunca antes vistos, que cuenta como único.

El mejor que he encontrado es este:

Dada una función, $Q(C, K, N)$ que calcula la probabilidad de que el $N^{th}$ evento tiene al menos un valor único:

Se obtendrían los siguientes valores en el estudiante escenario:

$$ Q(2, 365, 0) = 1 - \frac{0}{365}\frac{0}{365} = 1.00000 $$ $$ Q(2, 365, 1) = 1 - \frac{2}{365}\frac{2}{365} = 0.99996 $$ $$ Q(2, 365, 2) = 1 - \frac{4}{365}\frac{4}{365} = 0.99987 $$

Y lo mismo para el sorteo de la lotería:

$$ Q(5, 100, 0) = 1 - \frac{0}{100}\frac{0}{100} = 1.00000 $$ $$ Q(5, 100, 1) = 1 - \frac{5}{100}\frac{5}{100} = 0.99999 $$ $$ Q(5, 100, 2) = 1 - \frac{10}{100}\frac{10}{100} = 0.99999 $$

Esto se generaliza a:

$$ Q(C, K, N) = 1 - (\frac{N * K}{C})^K $$

Si $Q$ calcula la probabilidad de que cualquier alumno / a con al menos un día único que la probabilidad de que N todos los eventos que tengan al menos un día único es simplemente multiplicar todas las probabilidades juntos:

$$P(C, K, N) = \prod_{n=0}^N 1 - (\frac{n * K}{C})^{K}$$

Esto se ve prometedor, porque para el caso en que $K = 1$, esto se simplifica a:

$$\prod_{n=0}^N \frac{C - n}{C}$$

cual es la fórmula para el tradicional paradoja de cumpleaños.

El problema es que esta fórmula propuesta, más allá de $K=1$, no es realmente correcto, comprobado mediante una simulación monte-carlo he estado corriendo para compararla.

Me parece que no puede envolver mi cabeza alrededor de lo que el problema es, sin embargo. He probado con una docena de maneras diferentes de abordar el problema. Parece que no puede haber solución de forma cerrada, por desgracia.

1voto

Joseph Tary Puntos 731

Creo que la fórmula es más así:

$$ P(C,K,N)= \left(\prod_{n=0}^{N-1}\frac{C-n}{C}\right)\left(\frac{C-N+1}{C}\right)^{(K-1)*N} $$

Intuitivamente, usted tiene que elegir el $N$ sorteo que será único. Hay posibilidades de $C$ $C$ para el primer $C-1$ $C$ para el segundo y así sucesivamente (de ahí el $\prod_{n=0}^{N-1} \frac{C-n}{C}$).

Diez tienes que elegir el otro dibuja. Usted no puede escoger el único (a menos que el la está en el mismo evento como) por lo tanto es posible entre $C-N+1$ $C$ opciones y hay $(K-1)N$ tal sorteo (por lo tanto $\left(\frac{C-N+1}{C}\right)^{(K-1)N}$).

1voto

Aretino Puntos 5384

Estoy reescribiendo esta respuesta completamente, ya he encontrado el error en mi anterior intento. Como antes de que yo estoy tratando sólo con la $K=2$ de los casos (estudiantes de días especiales).

Deje $d$ el número de estudiantes que todavía tienen elementos únicos para ellos, $s$ ser el número de aquellos que sólo tienen un único elemento de y $u$ el número de elementos que son compartidos por dos o más estudiantes. Si $p(s,u,d)$ es la probabilidad de tener números, entonces tenemos la siguiente relación recursiva: \begin{equation} \begin{split} p(s,u,d)&=p(s-1,u,d) \left(1-{s+u+2d-1\over C}\right){1+2u\over C}+\\ &+p(s,u,d-1) \left(1-{s+u+2d-1\over C}\right)\left(1-{s+u+2d-2\over C}\right)+\\ &+p(s-2,u-1,d+1)\cdot 2{2d+2\over C}\left(1-{s+u+2d-1\over C}\right),\\ \end{split} \end{equation} donde $C$ es el número de días en un año. Esto debe ser complementado con la correspondiente de los valores de partida: \begin{equation} \begin{split} &p(0,0,1)={C-1\over C},\ \ p(1,0,0)={1\over C},\ \ p(0,0,0)=0,\\ &p(s,u,d)=0\ \ \hbox{if %#%#% or %#%#% or %#%#%},\\ &p(s,u,d)=0\ \ \hbox{if %#%#%}.\\ \end{split} \end{equation} Con respecto a mi anterior solución no es una complicación más, debido a la presencia de la variable $s<0$, pero ahora todos los resultados están muy bien: he comprobado con un cálculo explícito en el caso de $u<0$. Para obtener la probabilidad de $d<0$ que da $u>s/2$ estudiantes todos ellos tienen al menos un elemento único, uno tiene que resumir todos los $u$. Por ejemplo: $$ p_{tot}(3)=p(3,0,0)+p(3,1,0)+p(2,0,1)+p(2,1,1)+p(1,0,2)+p(0,0,3). $$ Esta probabilidad cae por debajo de $C=5$ $p_{tot}$ % estudiantes: $N$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X