9 votos

Diferencia entre dos variables aleatorias binomiales independientes con igual probabilidad de éxito

Dejemos que $X$ ~ $Bin(n,p)$ y $Y$ ~ $Bin(m,p)$ sean dos variables aleatorias independientes. Encuentre la distribución de $Z=X-Y$ .

ver también Diferencia de dos variables aleatorias binomiales

Me he dado cuenta de esto:

$$ P(Z=z)=\cases{\sum_{i=o}^{min(m,n)} Bin(k+i,n,p)*Bin(i,m,p), &if $ z\N-ge0 $;\cr \sum_{i=0}^{min(m,n)} Bin(i,n,p) * Bin(i-z, m, p),&otherwise. \cr}$$

También lo he validado mediante una simulación de Montecarlo. Para $n=30$ , $m=20$ y $p=0.5$ Obtengo la siguiente distribución, donde los círculos son las probabilidades analíticas y la línea conecta las estimaciones del MC.

enter image description here

Como eso me parecía una distribución binomial, lo intenté y descubrí que en realidad es una binomial, sólo que desplazada por m a la izquierda. Esto se puede escribir simplemente como $P(Y=y) = Bin(y+m, m+n, p)$ . Por lo tanto, dadas las mismas probabilidades de éxito, la suma de dos variables aleatorias independientes distribuidas binomialmente es binomial, pero también su diferencia, sólo que desplazada hacia la izquierda.

Esta pregunta aquí diferencia entre variables binomiales independientes es en realidad la misma que la mía, pero no recibió ninguna respuesta y sólo el comentario de que no habría una fórmula sencilla. Pero la fórmula anterior me parece bastante sencilla.

  • ¿Es correcto que para el caso de probabilidades de éxito iguales, las ecuaciones anteriores describen realmente la distribución de $Z=X-Y$ ?
  • Leí en un libro que $Z$ no podía tener una distribución binomial porque tenía soporte negativo. ¿Es correcto llamarlo binomio desplazado?

8voto

Nikolai Prokoschenko Puntos 2507

Su $Z=X-Y$ no será un "binomio desplazado" a menos que $p=\frac12$ o los casos triviales en los que al menos uno de $n$ y $m$ es cero. Para el caso $p=\frac12$ , $m-Y$ tiene la misma distribución que $Y$ así que $X+Y$ y $X-Y+m$ tienen la misma distribución, que es efectivamente binomial.

En general, considere las medias y las varianzas de las distribuciones:

  • $X$ tiene media $np$ y la varianza $np(1-p)$
  • $Y$ tiene media $mp$ y la varianza $mp(1-p)$
  • $X+Y$ tiene media $(n+m)p$ y la varianza $(n+m)p(1-p)$
  • $Z=X-Y$ tiene media $(n-m)p$ y la varianza $(n+m)p(1-p)$
  • $Z+m=X-Y+m$ tiene media $np+m(1-p)$ y la varianza $(n+m)p(1-p)$

Así que para $Z+m$ sea binomial y se apoye en los enteros de $0$ hasta $n+m$ si su parámetro era $q$ su media sería $(n+m)q$ y la varianza $(n+m)q(1-q)$ .

  • Para tener $(n+m)q(1-q)=(n+m)p(1-p)$ requiere $q=p$ o $q=1-p$ o $n+m=0$ (es decir $n=m=0$ ).
  • Para tener $q=p$ o $q=1-p$ y las dos expresiones para la media igual requieren $(n+m)p=np+m(1-p)$ o $(n+m)(1-p)=np+m(1-p)$ es decir $mp=m(1-p)$ o $n(1-p)=np$ que requeriría $p=\frac12$ o $m=0$ o $n=0$ .

Así que el único caso en el que $n\gt0$ y $m\gt0$ donde las medias y varianzas coinciden con una distribución binomial es cuando $p=\frac12$ .

3voto

Erel Segal-Halevi Puntos 2998

Si $n$ y $m$ son lo suficientemente grandes, puede utilizar el aproximación normal :

$X \approx N[np,npq]$

$Y \approx N[mp,mpq]$

$X-Y \approx N[mp-np,mpq+npq]$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X