Tengo un problema en el que hay M
usuarios que tienen que elegir entre un conjunto de N
posibles opciones. Quiero estimar la probabilidad media de que n
los artículos no son elegidos por nadie. Modelé esto como una distribución Bernoulli como:
$$P(n=k) = \left(\frac{n}{k}\right)\left(1 - \frac{1}{N}\right)^{M*k}\left(1 - \left(1 - \frac{1}{N}\right)^M\right)^{N-k}$$
y luego multiplico y sumo:
$$ A = \sum_{i=1}^{N} i * P(n = i) $$
Sin embargo, también implementé un pequeño programa que demuestra empíricamente esto, y veo que como M
aumento, obtengo algunos pequeños errores (como el 2-3 %). Me pregunto si me he perdido algo en la modelización de Bernoulli, ya que estoy 100% seguro de mi pequeño programa, o si hay que elegir algo diferente a Bernoulli.