Loading [MathJax]/extensions/TeX/mathchoice.js

20 votos

Diferencia de dos variables aleatorias binomiales

Podría alguien orientarme a un documento donde obtienen la distribución de la diferencia entre dos variables aleatorias binomiales. Así XBin(n1,p1) y YBin(n2,p2), cuál es la distribución de los |XY|.

Gracias.

(También X y Y son independientes)

18voto

Simon Raper Puntos 21

Me puede dar una respuesta para el pmf de X-Y. a partir De allí |X - Y| es sencillo.

Así que empezamos con

XBin(n1,p1)

YBin(n2,p2)

Estamos buscando la función de masa de probabilidad de Z=XY

En primer lugar observamos que el mínimo y el máximo del apoyo de Z debe ser (n2,n1) desde que cubre la mayoría de los casos extremos ( X=0 Y=n2 ) y ( X=n1 Y=0 ).

Entonces necesitamos una modificación de la binomial pmf para que pueda hacer frente con valores fuera de los límites de su apoyo.

m(k, n, p) = \binom {n} {k} p^k (1-p)^{n-k} al k \leq n y 0 en caso contrario.

Entonces tenemos que definir dos casos

  1. Z \geq 0
  2. Z \lt 0

En el primer caso

p(z) = \sum_{i=0}^{n_1} m(i+z, n_1, p_1) m(i, n_2, p_2)

ya que este cubre todas las formas en que X-Y podría igualdad de z. Por ejemplo, cuando z=1 esto se alcanza cuando X=1 y Y=0 y X=2 y Y=1 y X=3 y Y=4 y así sucesivamente. También se ocupa de los casos que no podría suceder debido a que los valores den_1n_2. Por ejemplo, si n_2 = 4, entonces no podemos obtener Z=1 como una combinación de X=4 y Y=5. En este caso gracias a nuestro modificado binomio pmf la probabilidad es cero.

Para el segundo caso que acabamos de invertir los roles. Por ejemplo, si z=-1, entonces este se alcanza cuando X=0 y Y=1, X=1 y Y=2, etc.

p(z) = \sum_{i=0}^{n_2} m(i, n_1, p_1) m(i+z, n_2, p_2)

Póngalos juntos y que su pmf.

f(z)= \begin{cases} \sum_{i=0}^{n_1} m(i+z, n_1, p_1) m(i, n_2, p_2),& \text{if } z\geq 0\\ \sum_{i=0}^{n_2} m(i, n_1, p_1) m(i+z, n_2, p_2), & \text{otherwise} \end{casos}

Aquí está la función en R y una simulación para comprobar que es correcto (y funciona.)

https://gist.github.com/coppeliaMLA/9681819

13voto

Matthew Scouten Puntos 2518

Dudo que hay un nombre especial para la distribución en general. Hay un caso especial de interés: p_1 = 1 - p_2. Tenga en cuenta que n_2 - Y \sim {\text Bin}(n_2, 1-p_2) y en este caso especial X - Y + n_2 \sim {\text Bin}(n_1 + n_2, p_1).

11voto

Will Green Puntos 758

Esta pregunta es más difícil de lo que parece. Para resolver esto, voy a utilizar aquí una combinación de ambos manual de métodos y automatizado de los métodos, en particular de álgebra computacional herramientas [la mathStatica paquete (de la cual soy autor) para Mathematica y el último en sí mismo].

Si me puede cambiar la notación ligeramente:

El Problema

Vamos X_1 ~ Binomial(n,p) y X_2 ~ Binomial(m,q) ser independiente.

Encontrar el pmf de |X_1-X_2|

Dado: Debido a la independencia, la articulación pmf de (X_1, X_2), decir f(x_1,x_2), es:

Solución

Deje Y=X_1-X_2Z=X_2. Entonces, la articulación pmf de (Y,Z), decir g(y,z), es:

donde Transform es mathStatica función que se deriva de la articulación pmf utilizando el Método de las Transformaciones. Derivando el dominio de apoyo de Y Z es un poco más complicado. Para hacer las cosas más claras, aquí es áspero de un gráco que ilustra la (suavizada continua de la versión de) el dominio de apoyo:

Esto sugiere dos casos:

  • Caso 1: Cuando y \ge 0: 0 \le z \le n-y

  • Caso 2: Cuando y < 0: -y \le z \le m

La densidad de Y=X_1-X_2 se obtiene sumando a cabo Z en cada parte del dominio:

Finalmente, para encontrar el pmf de |Y|, el pmf estrictamente positivos valores serán:

y al Y=0:

Resumen

El pmf de |X_1-X_2|, decir \phi(y) es:

con el dominio de apoyo Y = {0, 1, ..., max(m,n)}.

Todo hecho.


Monte Carlo de verificación

Siempre es una buena idea para comprobar el trabajo utilizando métodos de Monte Carlo. Aquí, por ejemplo, son 100.000 pseudo-aleatoria de los dibujos de cada una de las X_1X_2, dado que algunos parámetros supuestos:

x1data = RandomVariate[BinomialDistribution[12, .1],  100000];
x2data = RandomVariate[BinomialDistribution[ 7, .9],  100000];

A continuación, comparar la distribución empírica de los |X_1-X_2| (triángulos rojos) para el teórico de la densidad de \phi(y) (puntos azules) derivada de la anterior, dado que el mismo parámetro supuestos:

Se ve bien :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X