2 votos

¿Cómo evaluar numéricamente la FCD de esta variable aleatoria?

Tengo una variable aleatoria discreta $X=0,1,2,\ldots$ con la siguiente función de masa de probabilidad:

$$P(X=x)=\sum_{t=0}^x\binom{n}{t}p^t(1-p)^{n-t}\binom{m-t}{x-t}q^{x-t}(1-q)^{m-x}\tag{1}$$

donde $0<p,q<1$ , $n\gg0$ y $m=an$ con $a>1$ . Los valores que estoy utilizando son $p=2\times10^{-3}$ , $q=10^{-4}$ , $n=10^5$ y $a=30$ (así $m=3\times10^6$ ). Estoy interesado en hacer $p$ incluso más pequeñas (tan bajas como $2\times 10^6$ y tal vez inferior), y aumentando $n$ a tanto como $10^6$ (con el correspondiente aumento de $m$ ).

Esencialmente, $X$ es una "mezcla binomial" de variables aleatorias binomiales.

Me gustaría calcular su distribución acumulativa $F_X(s)=\sum_{x=0}^{s}P(X=x)$ para valores relativamente pequeños de $s$ (donde debería concentrarse la mayor parte de esta distribución). Me conformaría con límites superiores e inferiores ajustados o aproximaciones de la FCD de $X$ .

Ahora mismo, me cuesta incluso evaluar (1) con los valores anteriores. ¿Alguien tiene ideas? ¿Qué estoy haciendo mal? ¿Qué más puedo probar?

LO QUE HE HECHO

  1. Intenté introducir los valores anteriores en Wolfram Mathematica, y sólo evaluando la suma tal cual. Resultado: desbordamiento (debido a los binomios).

  2. Suma probada $\sum_{x=0}^s\hat{p}(x)$ sobre la siguiente aproximación gaussiana aproximación gaussiana de la f.m.p: $$\hat{p}(x)=\int_{0}^{x}\frac{\exp\left[-\frac{(t-np)^2}{2np(1-p)}\right]}{\sqrt{2\pi np(1-p)}}\frac{\exp\left[-\frac{(x-t-(m-t)q)^2}{2(m-t)q(1-q)}\right]}{\sqrt{2\pi (m-t)q(1-q)}}dt$$

    La aproximación se debe a la teorema del límite local para la binomial variables aleatorias binomiales Sin embargo, no estoy seguro de que se aplique en este caso. I Tengo $\approx2.85\times 10^{-94}$ evaluando la suma para $s=40$ y los parámetros anteriores en Wolfram Mathematica, lo cual no es correcto.

2voto

Did Puntos 1

Dejemos que $r=p+q-pq$ entonces $X=Y+Z$ donde $Y$ es binomial $(n,r)$ , $Z$ es binomial $(m-n,q)$ y $Y$ y $Z$ son independientes.

Así, las aproximaciones gaussianas son $$Y=nr+\sqrt{nr(1-r)}\,U_n, $$ y $$Z=(m-n)q+\sqrt{(m-n)q(1-q)}\,V_{m-n},$$ donde $U_n\to U$ y $V_{m-n}\to V$ en la distribución, para algunas variables aleatorias normales independientes $U$ y $V$ . Así, $$X=np(1-q)+mq+\varrho W_{m,n},$$ donde $W_{m,n}\to W$ en la distribución, para alguna variable aleatoria normal estándar $W$ con $$ \varrho^2=nr(1-r)+(m-n)q(1-q). $$

Editar: Para demostrar la primera afirmación, se puede identificar la función generadora de alguna variable aleatoria $X$ con la distribución en la pregunta. Esto es $$ E(s^X)=\sum_xP(X=x)s^x=\sum_t\binom{n}{t}(sp)^t(1-p)^{n-t}A_x, $$ donde $$ A_x=\sum_x\binom{m-t}{x-t}(sq)^{x-t}(1-q)^{m-x}=(sq+1-q)^{m-t}, $$ por lo que $$ E(s^X)=(sq+1-q)^{m-n}\sum_t\binom{n}{t}(sp)^t(1-p)^{n-t}(sq+1-q)^{n-t}, $$ y la suma en el lado derecho es $$ (sp+(1-p)(sq+1-q))^n=(1-r+rs)^n, $$ por lo que $E(s^X)=E(s^Y)E(s^Z)$ , según se desee.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X