10 votos

¿Cuál es la distribución de probabilidad de esta suma aleatoria de variables Bernoulli no iid?

Intento encontrar la distribución de probabilidad de una suma de un número aleatorio de variables que no están idénticamente distribuidas. He aquí un ejemplo:

John trabaja en un centro de llamadas de atención al cliente. Recibe llamadas con problemas y trata de resolverlos. Las que no puede resolver, las remite a su superior. Supongamos que el número de llamadas que recibe al día sigue una distribución de Poisson con media $\mu$ . La dificultad de cada problema varía desde cosas bastante sencillas (con las que sin duda puede lidiar) hasta cuestiones muy especializadas que no sabrá resolver. Supongamos que la probabilidad $p_i$ será capaz de resolver el i -El problema sigue una distribución Beta con parámetros $\alpha$ y $\beta$ y es independiente de los problemas anteriores. ¿Cuál es la distribución del número de llamadas que resuelve en un día?

Más formalmente, sí:

$Y = I(N > 0)\sum_{i = 0}^{N} X_i$ para $i = 0, 1, 2, ..., N$

donde $N \sim \mathrm{Poisson}(\mu)$ , $(X_i | p_i) \sim \mathrm{Bernoulli}(p_i)$ y $p_i \sim \mathrm{Beta}(\alpha, \beta)$

Tenga en cuenta que, por ahora, estoy feliz de asumir que el $X_i$ son independientes. También aceptaría que los parámetros $\mu, \alpha$ y $\beta$ no se afectan mutuamente aunque en un ejemplo de la vida real cuando $\mu$ es grande, los parámetros $\alpha$ y $\beta$ son tales que la distribución Beta tiene más masa en las tasas de éxito bajas $p$ . Pero ignoremos eso por ahora.

Puedo calcular $P(Y = 0)$ pero eso es todo. También puedo simular valores para hacerme una idea de cuál es la distribución de $Y$ parece (parece Poisson pero no sé si eso se debe a los números de $\mu, \alpha$ y $\beta$ He probado o si se generaliza, y cómo podría cambiar para diferentes valores de los parámetros). ¿Alguna idea de cuál es esta distribución o cómo podría derivarla?

Tenga en cuenta que también he publicado esta pregunta en Foro de TalkStats pero pensé que podría recibir más atención aquí. Disculpas por el cross-posting y muchas gracias de antemano por su tiempo.

EDITAR : Resulta que (ver las respuestas muy útiles más abajo - ¡y gracias por ellas!), es efectivamente un $\mathrm{Poisson}(\frac{\mu\alpha}{\alpha + \beta})$ algo que suponía basándome en mi intuición y en algunas simulaciones, pero que no pude demostrar. Sin embargo, lo que ahora me sorprende es que la distribución de Poisson sólo depende de la media del $\mathrm{Beta}$ distribución, pero no se ve afectada por su varianza.

Como ejemplo, las siguientes dos distribuciones Beta tienen la misma media pero diferente varianza. Para mayor claridad, la pdf azul representa una $\mathrm{Beta}(2, 2)$ y el rojo $\mathrm{Beta}(0.75, 0.75)$ .

Beta Distributions

Sin embargo, ambos darían lugar a la misma $\mathrm{Poisson}(0.5\mu)$ distribución que, para mí, parece ligeramente contraintuitiva. (No digo que el resultado sea erróneo, sólo que es sorprendente).

0 votos

Para los fijos $N$ hay Distribución de Poisson-binomio pero tu problema es más complicado que esto.

0 votos

Gracias, conozco la distribución Poisson-binomial pero $N$ es aleatorio aquí.

0 votos

Podría echar un vistazo a la Poisson compuesto pero es posible que tengas que trabajar un poco con los 0s para que sea útil

6voto

Casey Jones Puntos 111

Las llamadas (es decir, los $X_i$ ) llegan según un proceso de Poisson. El número total de llamadas $N$ sigue una distribución de Poisson. Dividir las llamadas en dos tipos, por ejemplo, si $X_i = 1$ o $X_i = 0$ . El objetivo es determinar el proceso que genera la $1$ s. Esto es trivial si $X_i = 1$ con una probabilidad fija $p$ por el principio de superposición de los procesos de Poisson, el proceso completo se adelanta a sólo el $1$ s sería también un proceso de Poisson, con la tasa $p\mu$ . De hecho, así es, sólo necesitamos un paso adicional para llegar a él.

Marginar por encima de $p_i$ para que $$\mathrm{Pr}(X_i|\alpha, \beta) = \int_0^1 p_i^{X_i} (1-p_i)^{1-X_i} \frac{p_i^{\alpha-1} (1-p_i)^{\beta-1}}{\mathcal{B}(\alpha, \beta)} dp_i = \frac{\mathcal{B}(X_i + \alpha, 1 - X_i + \beta)}{\mathcal{B}(\alpha, \beta)}$$

Dónde $\mathcal{B}(a, b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a + b)}$ es la función beta. Utilizando el hecho de que $\Gamma(x+1) = x\Gamma(x)$ lo anterior se simplifica a;

$$\mathrm{Pr}(X_i = 1|\alpha, \beta) = \frac{\Gamma(1+\alpha)\Gamma(\beta)}{\Gamma(1+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} = \frac{\alpha}{\alpha+\beta}$$ En otras palabras, $X_i \sim \mathrm{Bernoulli}(\frac{\alpha}{\alpha+\beta})$ . Por la propiedad de superposición, $Y$ tiene una distribución de Poisson con una tasa $\frac{\alpha \mu}{\alpha+\beta}$ .

Un ejemplo numérico (con R) ... en la figura, las líneas verticales son de la simulación y los puntos rojos son los pmf derivados anteriormente:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

enter image description here

3voto

Alan Puntos 7273
  1. Desde $p_i$ es una variable aleatoria con un $\operatorname{Beta}(\alpha,\beta)$ tienes $\mathbb{E}[p_i]= \dfrac{\alpha}{\alpha+\beta}$ y ésta es, de hecho, la probabilidad de que Juan resuelva realmente el $i$ El problema es el mismo, independientemente de todos los demás.

  2. Dado que el número total de problemas en un día tiene una distribución de Poisson con parámetro $\mu$ y cada uno se resolverá con probabilidad $\dfrac{\alpha}{\alpha+\beta}$ el número que Juan resuelve cada día tiene una distribución de Poisson con parámetro $\dfrac{\mu\alpha}{\alpha+\beta}$

  3. Su cálculo de la probabilidad de que no resuelva ningún problema debe ser $\mathbb{P}(Y=0) = e^{-{\mu\alpha}/({\alpha+\beta})}$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X