Si tengo $N$ ollas, y para $k$ iteraciones selecciono al azar una olla y tiro una piedra en ella, ¿qué distribución tengo para el número de piedras en una olla concreta? Podemos suponer $k \geq 100$ más o menos, y que el número de macetas $N$ es $\leq \frac{k}{10}$ más o menos. También estaría abierto a ajustar un poco estos supuestos en una dirección que se preste a una buena distribución.
Respuesta
¿Demasiados anuncios?El número aleatorio de piedras en cada maceta $X_1, X_2, \ldots, X_N$ sigue una distribución multinomial con parámetros $p_1 = p_2 = \ldots = p_N = 1/N$ y $k$ ensayos: $$\Pr[\boldsymbol X = \boldsymbol x] = \binom{k}{x_1, x_2, \ldots, x_N} p_1^{x_1} p_2^{x_2} \ldots p_N^{x_N} = \frac{k!}{x_1! x_2! \ldots x_N!} \frac{1}{N^k}, $$ donde $0 \le x_1, x_2, \ldots x_N \le k$ , $\sum x_i = k$ , $p_1 = p_2 = \ldots = p_N = \frac{1}{N}$ .
Así, por ejemplo, si $N = 5$ y $k = 100$ entonces la probabilidad de que haya $10$ , $15$ , $20$ , $25$ y $30$ piedras en la primera, segunda, tercera, cuarta y quinta ollas respectivamente es $$\Pr[\boldsymbol X = (10, 15, 20, 25, 30)] = \frac{100!}{10!15!20!25!30!} \cdot \frac{1}{5^{100}} \approx 2.49064 \times 10^{-7}.$$
Sin embargo, si se desea conocer la distribución del número de piedras de un solo sin tener en cuenta el resultado de todos los demás botes, entonces sigue una distribución binomial, con el parámetro $p = 1/N$ : $$\Pr[X = x] = \binom{k}{x} (1/N)^x (1-1/N)^{k-x},$$ donde $X$ es el número de piedras en la olla de interés. Por ejemplo, en el ejemplo anterior, si estuviéramos interesados en la probabilidad de ver $10$ piedras en la primera olla, entonces esto es $$\Pr[X_1 = 10] = \binom{100}{10} (1/5)^{10} (4/5)^{100-10} \approx 0.00336282.$$
En el caso de $N$ y $k$ grande, tal que $k/N$ se supone una tasa constante $\lambda$ entonces la distribución de probabilidad del número de piedras en un único bote distinguido (por ejemplo, el primer bote) es Poisson con parámetro $\lambda = k/N$ : $$\Pr[X = x] = e^{-\lambda} \frac{\lambda^x}{x!}.$$ Así, con $k = 100$ y $N = 5$ como arriba, $\lambda = 20$ y $$\Pr[X = 10] = e^{-20} \frac{20^{10}}{10!} \approx 0.00581631.$$ Esta aproximación es mejor cuando $\lambda$ es pequeño y $k$ es muy grande, por lo que comparar $k = 1000$ , $N = 250$ , $\lambda = 4$ obtenemos $\Pr[X = 10] \approx 0.00529248$ bajo Poisson, y $\Pr[X = 10] \approx 0.00522368$ bajo la distribución Binomial.
En $k$ es grande pero $N$ es pequeño, es más apropiada una aproximación Normal, con media $\mu = k/N$ y varianza $\sigma^2 = k/N(1-1/N)$ .