2 votos

¿Por qué MCMCpack utiliza priores normales cuando ejecuta la regresión de Poisson?

Pensaba que como la prioritaria conjugada de la distribución de Poisson es gamma, debíamos utilizarla al asignar distribuciones a priori al coeficiente beta. Tanto MCMCpack como rstanarm especifican una distribución normal multivariante. ¿Puede alguien explicar el razonamiento detrás de eso?

4voto

Joe Puntos 166

Si $Y_i \stackrel{ind}{\sim} Poisson(\lambda)$ y $\lambda \sim Gamma(a, b)$ entonces $$\lambda | Y_1, \ldots, Y_n \sim Gamma\left(\sum_{i = 1}^n y_i + a, n + b\right)$$ como usted ha señalado.

Sin embargo, una regresión de Poisson se configura de forma diferente:

Si $Y_i \stackrel{ind}{\sim} Poisson(\lambda)$ un modelo de regresión para $\lambda$ puede definirse como $$ log(\lambda) = \beta_0 + \beta_1 X_{i,1} + \ldots + \beta_p X_{i,p} $$ donde $\mathbf{\beta} = [\beta_0, \beta_1, \ldots, \beta_p]$ es un vector de coeficientes. No existe una distribución a priori conjugada para el $\beta$ en la regresión de Poisson.

Se podría definir la distribución a priori gamma para cada $\beta_i$ como usted propuso, pero entonces afirmaríamos que cada $\beta_i$ no puede ser negativo porque la distribución gamma sólo está definida para valores positivos.

Esto podría ser un problema porque no está permitiendo que una covariable tenga una relación negativa con el número medio de recuentos $\lambda$ . Por ejemplo, si $Y_i$ es el número de niños en el país $i$ y $X_{i,1}$ es la riqueza del país $i$ entonces $\beta_1$ podría ser negativo, indicando que la gente tiene menos hijos a medida que sus países se enriquecen.

El único caso para el que tenemos un previo conjugado es para $\beta$ es la regresión lineal normal, donde la distribución normal a priori para $\beta$ es conjugada con la distribución normal para la variable de respuesta.

Supongo que la distribución normal a priori para $\beta$ en la regresión de Poisson sólo sigue la regresión lineal normal. Además, los hiperparámetros de la distribución a priori normal son fáciles de interpretar, un previo menos informativo (es decir, de alta varianza) es fácil de definir y la distribución normal se define en la línea real, lo que significa que los coeficientes $\beta_i$ puede asumir cualquier valor real.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X