Me gustaría saber cuál es la distribución incondicional de la variable$y \sim \text{Neg-Bin}(r, p)$ cuando$r \sim \text{Poisson}(\lambda)$.
Respuestas
¿Demasiados anuncios?Que yo sepa distribución de Poisson no es un conjugado antes de $r$ parámetro de la distribución binomial negativa. Sin embargo, si usted necesita para estimar el $r$ el uso de Poisson antes, entonces puede lograrse fácilmente utilizando el máximo de una estimación a posteriori mediante una búsqueda directa a través de una rejilla (es decir, que se puede estimar no normalizados posterior para todos los valores de una cuadrícula de puntos y, a continuación, encontrar el máximo). Búsqueda directa es factible aquí ya que mientras en la teoría de los valores de $r$ son countably infinito, en la práctica no sería un número finito de valores con la no despreciable de probabilidades, por lo que necesita para posiblemente de verificación en contra de $N+1$ valores (enteros $0,1,\dots,N$). Si $r$ sí no es un gran valor, $N$ también no necesita ser enorme, así que ir a través de todos los posibles valores que ser muy rápido para cualquier ordenador moderno.
set.seed(123)
ptrue <- 0.32
rtrue <- 42
X <- rnbinom(200, rtrue, ptrue)
nmax <- 500
lambda <- 60
res <- numeric(nmax+1)
for (j in 0:nmax)
res[j+1] <- sum(dnbinom(X, j, ptrue, log = TRUE)) + dpois(j, lambda, log = TRUE)
Como se puede ver en el gráfico siguiente, el uso de hyperparameter $\lambda=60$ considera que la distribución posterior de los $r$ alcanza su máximo en el valor de $44$, que es bastante cerca del verdadero valor igual a $42$.
plot(0:nmax, res, type = "l")
abline(v = which.max(res)+1, col = "red")
Si usted necesita para encontrar la normalización constante, entonces usted también puede evaluar los no normalizados posterior a través de una cuadrícula con algunos arbitraria grandes límite superior (distribución de Poisson ha $[0, \infty)$ de apoyo) y la suma de ellos, para obtener una aproximación del teorema de Bayes
$$ g(r\mid x,p) = \frac{ \overbrace{f(x\mid r,p)}^\text{likelihood} \, \overbrace{g(r\mid\lambda)}^\text{prior} }{ \sum_{j=0}^{\infty} f(x\mid j,p) \, g(j\mid\lambda) } $$
where you would sum up to some arbitrary large integer instead of summing over all the possible values of $j$.
Honestly, even if analytical solution for this problem existed, then using a direct search (or other similar approaches) is so simple that it would less time to obtain estimates like this, then to find and verify the analytical solution.
Notice that the method described above could also be used if the question is understood like in the answer provided by StatsPlease. In such case for some $x$ of interest you would be summing over values of $r$ desde cero hasta arbitraria de enteros grandes.
Creo que hay un poco de confusión en torno a qué es exactamente la pregunta está pidiendo. Sé que @Tim ha dado una respuesta a esta pregunta, pero mi interpretación de la pregunta era diferente.
Como lo que yo puedo decir, usted tiene las siguientes distribuciones:
$$Y\,|\,r\sim \text{NB}(r,p)$$
y
$$r\sim \text{Poisson}(\lambda)$$
La distribución anterior, $Y\,|\,r$ es un condicional de distribución. Por lo que puedo decir, usted quiere encontrar la distribución de $Y$ no condicional en $r$. Esto no es (tan lejos como soy consciente de que) conoce como un incondicional de distribución, sino más bien a la marginal de la distribución de $Y$.
Ahora, estas distribuciones son discretos, y la expresión para la densidad de $Y$ puede ser escrita como:
$$f_{Y}(y)=\sum_{r}f_{r,Y}(r,y)$$ donde $f_{r,Y}(r,y)$ es la articulación de la densidad de $r$$Y$. Ahora, esto puede ser expresado como:
$$f_{Y}(y)=\sum_{r}f_{Y|r}(y|r)f_{r}(r)$$
Dado que las densidades son:
$$\begin{align} f_{Y|r}(y|r)&={{y+r-1}\choose{y}}(1-p)^{r}p^{y}\\ f_{r}(r)&=\frac{\lambda^{r}e^{-\lambda}}{r!} \end{align}$$
Ahora, yo no podía encontrar una forma cerrada de solución para la densidad de $Y$ (tal vez alguien más puede). Pero lo hice correr algunas simulaciones para tener una idea de la distribución de $Y$ para un conjunto de parámetros de $(p,\lambda)$. A partir de las simulaciones de ejecución, luego de encontrar el MLE para los datos resultantes de una $\text{NB}(r,p)$ donde $p$ es fijo (como es un parámetro conocido). Los resultados fueron algo interesante:
$$Y\,|\,r\sim\text{NB}(r,p)\overset{*}{\Leftrightarrow} Y\sim\text{NB}(E[r]=\lambda,p)$$
$^{*}$Esto es puramente especulativo.
Esencialmente, el resultado es $r$ parámetro de la distribución binomial negativa fue siempre muy cerca:
$$r\approx E[r]=\lambda$$
Aquí está la comparación de la distribución obtenida utilizando los resultados de la simulación y la distribución donde la binomial negativa de parámetros $r=\lambda$. Una vez más, esto es especulativo, sólo pensé que era muy interesante!
Miré un poco más al este, para diferentes valores de $\lambda$, $p$ y simulaciones $N$.