Si tengo N ollas, y para k iteraciones selecciono al azar una olla y tiro una piedra en ella, ¿qué distribución tengo para el número de piedras en una olla concreta? Podemos suponer k≥100 más o menos, y que el número de macetas N es ≤k10 más o menos. También estaría abierto a ajustar un poco estos supuestos en una dirección que se preste a una buena distribución.
Respuesta
¿Demasiados anuncios?El número aleatorio de piedras en cada maceta X1,X2,…,XN sigue una distribución multinomial con parámetros p1=p2=…=pN=1/N y k ensayos: \Pr[\boldsymbol X = \boldsymbol x] = \binom{k}{x_1, x_2, \ldots, x_N} p_1^{x_1} p_2^{x_2} \ldots p_N^{x_N} = \frac{k!}{x_1! x_2! \ldots x_N!} \frac{1}{N^k}, donde 0 \le x_1, x_2, \ldots x_N \le k , \sum x_i = k , p_1 = p_2 = \ldots = p_N = \frac{1}{N} .
Así, por ejemplo, si N = 5 y k = 100 entonces la probabilidad de que haya 10 , 15 , 20 , 25 y 30 piedras en la primera, segunda, tercera, cuarta y quinta ollas respectivamente es \Pr[\boldsymbol X = (10, 15, 20, 25, 30)] = \frac{100!}{10!15!20!25!30!} \cdot \frac{1}{5^{100}} \approx 2.49064 \times 10^{-7}.
Sin embargo, si se desea conocer la distribución del número de piedras de un solo sin tener en cuenta el resultado de todos los demás botes, entonces sigue una distribución binomial, con el parámetro p = 1/N : \Pr[X = x] = \binom{k}{x} (1/N)^x (1-1/N)^{k-x}, donde X es el número de piedras en la olla de interés. Por ejemplo, en el ejemplo anterior, si estuviéramos interesados en la probabilidad de ver 10 piedras en la primera olla, entonces esto es \Pr[X_1 = 10] = \binom{100}{10} (1/5)^{10} (4/5)^{100-10} \approx 0.00336282.
En el caso de N y k grande, tal que k/N se supone una tasa constante \lambda entonces la distribución de probabilidad del número de piedras en un único bote distinguido (por ejemplo, el primer bote) es Poisson con parámetro \lambda = k/N : \Pr[X = x] = e^{-\lambda} \frac{\lambda^x}{x!}. Así, con k = 100 y N = 5 como arriba, \lambda = 20 y \Pr[X = 10] = e^{-20} \frac{20^{10}}{10!} \approx 0.00581631. Esta aproximación es mejor cuando \lambda es pequeño y k es muy grande, por lo que comparar k = 1000 , N = 250 , \lambda = 4 obtenemos \Pr[X = 10] \approx 0.00529248 bajo Poisson, y \Pr[X = 10] \approx 0.00522368 bajo la distribución Binomial.
En k es grande pero N es pequeño, es más apropiada una aproximación Normal, con media \mu = k/N y varianza \sigma^2 = k/N(1-1/N) .