Tengo una variable aleatoria discreta $X=0,1,2,\ldots$ con la siguiente función de masa de probabilidad:
$$P(X=x)=\sum_{t=0}^x\binom{n}{t}p^t(1-p)^{n-t}\binom{m-t}{x-t}q^{x-t}(1-q)^{m-x}\tag{1}$$
donde $0<p,q<1$ , $n\gg0$ y $m=an$ con $a>1$ . Los valores que estoy utilizando son $p=2\times10^{-3}$ , $q=10^{-4}$ , $n=10^5$ y $a=30$ (así $m=3\times10^6$ ). Estoy interesado en hacer $p$ incluso más pequeñas (tan bajas como $2\times 10^6$ y tal vez inferior), y aumentando $n$ a tanto como $10^6$ (con el correspondiente aumento de $m$ ).
Esencialmente, $X$ es una "mezcla binomial" de variables aleatorias binomiales.
Me gustaría calcular su distribución acumulativa $F_X(s)=\sum_{x=0}^{s}P(X=x)$ para valores relativamente pequeños de $s$ (donde debería concentrarse la mayor parte de esta distribución). Me conformaría con límites superiores e inferiores ajustados o aproximaciones de la FCD de $X$ .
Ahora mismo, me cuesta incluso evaluar (1) con los valores anteriores. ¿Alguien tiene ideas? ¿Qué estoy haciendo mal? ¿Qué más puedo probar?
LO QUE HE HECHO
-
Intenté introducir los valores anteriores en Wolfram Mathematica, y sólo evaluando la suma tal cual. Resultado: desbordamiento (debido a los binomios).
-
Suma probada $\sum_{x=0}^s\hat{p}(x)$ sobre la siguiente aproximación gaussiana aproximación gaussiana de la f.m.p: $$\hat{p}(x)=\int_{0}^{x}\frac{\exp\left[-\frac{(t-np)^2}{2np(1-p)}\right]}{\sqrt{2\pi np(1-p)}}\frac{\exp\left[-\frac{(x-t-(m-t)q)^2}{2(m-t)q(1-q)}\right]}{\sqrt{2\pi (m-t)q(1-q)}}dt$$
La aproximación se debe a la teorema del límite local para la binomial variables aleatorias binomiales Sin embargo, no estoy seguro de que se aplique en este caso. I Tengo $\approx2.85\times 10^{-94}$ evaluando la suma para $s=40$ y los parámetros anteriores en Wolfram Mathematica, lo cual no es correcto.