12 votos

Densidad de hiperpriors para modelo jerárquico Gamma-Poisson

En un modelo jerárquico de datos $ y $ donde $$y \sim \textrm{Poisson}(\lambda)$$ $$\lambda \sim \textrm{Gamma}(\alpha, \beta)$$ parece ser típico en la práctica elegir valores $(\alpha, \beta)$ de manera que la media y la varianza de la distribución gamma se ajusten aproximadamente a la media y la varianza de los datos $ y $ (por ejemplo, Clayton y Kaldor, 1987 "Estimaciones empíricas de Bayes de riesgos relativos estandarizados por edad para el mapeo de enfermedades," Biometrics). Claramente, esto es simplemente una solución ad hoc, ya que esto sobrestimar la confianza del investigador en los parámetros $(\alpha, \beta)$ y pequeñas fluctuaciones en los datos realizados podrían tener grandes consecuencias para la densidad gamma, incluso si el proceso subyacente de generación de datos permanece igual.

Además, en Análisis de datos bayesianos (2da ed.), Gelman escribe que este método es "descuidado;" en el libro y este artículo (comenzando en p. 3232), en cambio, sugiere que debería elegirse alguna densidad de hiperprior $p(\alpha, \beta)$, de manera similar al ejemplo de tumores de ratas (comenzando en p. 130).

Aunque está claro que cualquier $p(\alpha, \beta)$ es admisible siempre que produzca una densidad posterior finita, no he encontrado ejemplos de densidades de hiperprior que los investigadores hayan utilizado para este problema en el pasado. Agradecería mucho si alguien pudiera señalarme libros o artículos que hayan utilizado una densidad de hiperprior para estimar un modelo Poisson-Gamma. Idealmente, estoy interesado en $p(\alpha, \beta)$ que sea relativamente plano y sería dominado por los datos como en el ejemplo de tumores de ratas, o una discusión que compare varias especificaciones alternativas y los compromisos asociados con cada una.

6voto

bheklilr Puntos 113

No estoy respondiendo realmente a la pregunta, ya que no te estoy señalando libros o artículos que hayan utilizado un hiperprior, sino que estoy describiendo, y enlazando, información sobre priors en los parámetros Gamma.

Primero, nota que el modelo Poisson-Gamma conduce, cuando $\lambda$ se integra, a una distribución Binomial Negativa con parámetros $\alpha$ y $\beta/(1+\beta)$. El segundo parámetro está en el rango $(0,1)$. Si deseas ser poco informativo, un prior de Jeffreys en $p = \beta/(1+\beta)$ podría ser apropiado. Podrías poner el prior directamente en $p$ o trabajar a través del cambio de variables para obtener:

$p(\beta) \propto \beta^{-1/2}(1+\beta)^{-1}$

Alternativamente, podrías notar que $\beta$ es el parámetro de escala de la distribución Gamma, y, genéricamente, el prior de Jeffreys para un parámetro de escala $\beta$ es $1/\beta$. Puede resultar curioso que el prior de Jeffreys para $\beta$ sea diferente entre los dos modelos, pero los modelos en sí no son equivalentes; uno es para la distribución de $y | \alpha, \beta$ y el otro es para la distribución de $\lambda | \alpha, \beta$. Un argumento a favor del primero es que, asumiendo que no hay agrupamiento, los datos realmente se distribuyen Binomial Negativa $(\alpha, p)$, por lo que poner los priors directamente en $\alpha$ y $p$ es lo correcto. Por otro lado, si, por ejemplo, tienes agrupamientos en los datos donde las observaciones en cada agrupamiento tienen el mismo $\lambda$, realmente necesitas modelar de alguna manera los $\lambda$, por lo que tratar $\beta$ como el parámetro de escala de una distribución Gamma parecería más apropiado. (Mis pensamientos sobre un tema posiblemente controvertido.)

El primer parámetro también puede abordarse a través de priors de Jeffreys. Si usamos la técnica común de desarrollar priors de Jeffreys para cada parámetro de manera independiente, y luego formar el prior conjunto (no de Jeffreys) como el producto de los dos priors de un solo parámetro, obtenemos un prior para el parámetro de forma $\alpha$ de una distribución Gamma:

$p(\alpha) \propto \sqrt{\text{PG}(1,\alpha)}$

donde la función poligamma $\text{PG}(1,\alpha) = \sum_{i=0}^{\infty}(i+\alpha)^{-2}$. Incómodo, pero truncable. Podrías combinar esto con cualquiera de los priors de Jeffreys anteriores para obtener una distribución conjunta de prior uniforme. Combinándolo con el prior $1/\beta$ para el parámetro de escala Gamma resulta en un prior de referencia para los parámetros Gamma.

Si deseamos seguir la ruta completa de Jeffreys, formando el verdadero prior de Jeffreys para los parámetros Gamma, obtendríamos:

$p(\alpha, \beta) \propto \sqrt{\alpha \text{PG}(1,\alpha)-1}/\beta$

Sin embargo, los priors de Jeffreys para parámetros multidimensionales a menudo tienen malas propiedades, así como malas características de convergencia. No sé si este es el caso para la Gamma, pero hacer pruebas proporcionaría información útil.

Para obtener más información sobre priors para la Gamma, consulta las páginas 13-14 de Un Catálogo de Priors No-Informativos, Yang y Berger. Hay muchas otras distribuciones allí también. Para obtener una visión general de los priors de Jeffreys y de referencia, aquí tienes algunas notas de conferencias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X