Dejemos que $X$ ~ $Bin(n,p)$ y $Y$ ~ $Bin(m,p)$ sean dos variables aleatorias independientes. Encuentre la distribución de $Z=X-Y$ .
ver también Diferencia de dos variables aleatorias binomiales
Me he dado cuenta de esto:
$$ P(Z=z)=\cases{\sum_{i=o}^{min(m,n)} Bin(k+i,n,p)*Bin(i,m,p), &if $ z\N-ge0 $;\cr \sum_{i=0}^{min(m,n)} Bin(i,n,p) * Bin(i-z, m, p),&otherwise. \cr}$$
También lo he validado mediante una simulación de Montecarlo. Para $n=30$ , $m=20$ y $p=0.5$ Obtengo la siguiente distribución, donde los círculos son las probabilidades analíticas y la línea conecta las estimaciones del MC.
Como eso me parecía una distribución binomial, lo intenté y descubrí que en realidad es una binomial, sólo que desplazada por m a la izquierda. Esto se puede escribir simplemente como $P(Y=y) = Bin(y+m, m+n, p)$ . Por lo tanto, dadas las mismas probabilidades de éxito, la suma de dos variables aleatorias independientes distribuidas binomialmente es binomial, pero también su diferencia, sólo que desplazada hacia la izquierda.
Esta pregunta aquí diferencia entre variables binomiales independientes es en realidad la misma que la mía, pero no recibió ninguna respuesta y sólo el comentario de que no habría una fórmula sencilla. Pero la fórmula anterior me parece bastante sencilla.
- ¿Es correcto que para el caso de probabilidades de éxito iguales, las ecuaciones anteriores describen realmente la distribución de $Z=X-Y$ ?
- Leí en un libro que $Z$ no podía tener una distribución binomial porque tenía soporte negativo. ¿Es correcto llamarlo binomio desplazado?