4 votos

Variable binomial negativa distribuida con Poisson previo.

Me gustaría saber cuál es la distribución incondicional de la variable$y \sim \text{Neg-Bin}(r, p)$ cuando$r \sim \text{Poisson}(\lambda)$.

3voto

Dipstick Puntos 4869

Que yo sepa distribución de Poisson no es un conjugado antes de $r$ parámetro de la distribución binomial negativa. Sin embargo, si usted necesita para estimar el $r$ el uso de Poisson antes, entonces puede lograrse fácilmente utilizando el máximo de una estimación a posteriori mediante una búsqueda directa a través de una rejilla (es decir, que se puede estimar no normalizados posterior para todos los valores de una cuadrícula de puntos y, a continuación, encontrar el máximo). Búsqueda directa es factible aquí ya que mientras en la teoría de los valores de $r$ son countably infinito, en la práctica no sería un número finito de valores con la no despreciable de probabilidades, por lo que necesita para posiblemente de verificación en contra de $N+1$ valores (enteros $0,1,\dots,N$). Si $r$ sí no es un gran valor, $N$ también no necesita ser enorme, así que ir a través de todos los posibles valores que ser muy rápido para cualquier ordenador moderno.

set.seed(123)
ptrue <- 0.32
rtrue <- 42
X <- rnbinom(200, rtrue, ptrue)

nmax <- 500
lambda <- 60

res <- numeric(nmax+1)
for (j in 0:nmax)
  res[j+1] <- sum(dnbinom(X, j, ptrue, log = TRUE)) + dpois(j, lambda, log = TRUE)

Como se puede ver en el gráfico siguiente, el uso de hyperparameter $\lambda=60$ considera que la distribución posterior de los $r$ alcanza su máximo en el valor de $44$, que es bastante cerca del verdadero valor igual a $42$.

plot(0:nmax, res, type = "l")
abline(v = which.max(res)+1, col = "red")

MAP estimates

Si usted necesita para encontrar la normalización constante, entonces usted también puede evaluar los no normalizados posterior a través de una cuadrícula con algunos arbitraria grandes límite superior (distribución de Poisson ha $[0, \infty)$ de apoyo) y la suma de ellos, para obtener una aproximación del teorema de Bayes

$$ g(r\mid x,p) = \frac{ \overbrace{f(x\mid r,p)}^\text{likelihood} \, \overbrace{g(r\mid\lambda)}^\text{prior} }{ \sum_{j=0}^{\infty} f(x\mid j,p) \, g(j\mid\lambda) } $$

where you would sum up to some arbitrary large integer instead of summing over all the possible values of $j$.

Honestly, even if analytical solution for this problem existed, then using a direct search (or other similar approaches) is so simple that it would less time to obtain estimates like this, then to find and verify the analytical solution.

Notice that the method described above could also be used if the question is understood like in the answer provided by StatsPlease. In such case for some $x$ of interest you would be summing over values of $r$ desde cero hasta arbitraria de enteros grandes.

3voto

jhensley2 Puntos 53

Creo que hay un poco de confusión en torno a qué es exactamente la pregunta está pidiendo. Sé que @Tim ha dado una respuesta a esta pregunta, pero mi interpretación de la pregunta era diferente.

Como lo que yo puedo decir, usted tiene las siguientes distribuciones:

$$Y\,|\,r\sim \text{NB}(r,p)$$

y

$$r\sim \text{Poisson}(\lambda)$$

La distribución anterior, $Y\,|\,r$ es un condicional de distribución. Por lo que puedo decir, usted quiere encontrar la distribución de $Y$ no condicional en $r$. Esto no es (tan lejos como soy consciente de que) conoce como un incondicional de distribución, sino más bien a la marginal de la distribución de $Y$.

Ahora, estas distribuciones son discretos, y la expresión para la densidad de $Y$ puede ser escrita como:

$$f_{Y}(y)=\sum_{r}f_{r,Y}(r,y)$$ donde $f_{r,Y}(r,y)$ es la articulación de la densidad de $r$$Y$. Ahora, esto puede ser expresado como:

$$f_{Y}(y)=\sum_{r}f_{Y|r}(y|r)f_{r}(r)$$

Dado que las densidades son:

$$\begin{align} f_{Y|r}(y|r)&={{y+r-1}\choose{y}}(1-p)^{r}p^{y}\\ f_{r}(r)&=\frac{\lambda^{r}e^{-\lambda}}{r!} \end{align}$$

Ahora, yo no podía encontrar una forma cerrada de solución para la densidad de $Y$ (tal vez alguien más puede). Pero lo hice correr algunas simulaciones para tener una idea de la distribución de $Y$ para un conjunto de parámetros de $(p,\lambda)$. A partir de las simulaciones de ejecución, luego de encontrar el MLE para los datos resultantes de una $\text{NB}(r,p)$ donde $p$ es fijo (como es un parámetro conocido). Los resultados fueron algo interesante:

$$Y\,|\,r\sim\text{NB}(r,p)\overset{*}{\Leftrightarrow} Y\sim\text{NB}(E[r]=\lambda,p)$$

$^{*}$Esto es puramente especulativo.

Esencialmente, el resultado es $r$ parámetro de la distribución binomial negativa fue siempre muy cerca:

$$r\approx E[r]=\lambda$$

Aquí está la comparación de la distribución obtenida utilizando los resultados de la simulación y la distribución donde la binomial negativa de parámetros $r=\lambda$. Una vez más, esto es especulativo, sólo pensé que era muy interesante!

enter image description here


Miré un poco más al este, para diferentes valores de $\lambda$, $p$ y simulaciones $N$.

Para $\lambda=2$: enter image description here

Para $\lambda=10$: enter image description here

Para $\lambda=50$: enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X