21 votos

¿Qué distribuciones a priori podrían/deberían utilizarse para la varianza en un modelo bayesiano jerárquico cuando interesa la varianza media?

En su ampliamente citado artículo Distribuciones a priori de los parámetros de varianza en modelos jerárquicos (916 citas hasta ahora en Google Scholar) Gelman propone que las buenas distribuciones a priori no informativas para la varianza en un modelo jerárquico bayesiano son la distribución uniforme y la distribución media t. Si entiendo bien las cosas, esto funciona bien cuando lo que interesa es el parámetro de localización (por ejemplo, la media). Sin embargo, a veces el parámetro de varianza es de interés principal, por ejemplo cuando se analizan datos de respuesta humana de tareas de cronometraje, la variabilidad media del cronometraje es a menudo la medida de interés. En esos casos no me queda claro cómo se podría modelar la variabilidad jerárquicamente con, por ejemplo, distribuciones uniformes, ya que después del análisis quiero obtener la credibilidad de la varianza media tanto a nivel de participante como a nivel de grupo. Para ello necesito utilizar distribuciones a priori que se puedan parametrizar con la varianza media o similar, ¿no?

Mi pregunta es entonces: ¿Qué distribuciones se recomiendan para construir un modelo jerárquico bayesiano cuando lo que interesa es la varianza de los datos?

Sé que la distribución gamma se puede reparametrizar para especificarla mediante la media y la DE. Por ejemplo, el modelo jerárquico a continuación es del libro de Kruschke Análisis bayesiano de datos . Pero Gelman esboza algunos problemas con la distribución gamma en su artículo y agradecería sugerencias de alternativas, preferiblemente alternativas que no sean difíciles de hacer funcionar en BUGS/JAGS.

enter image description here

3voto

peuhp Puntos 788

No estoy de acuerdo con la forma en que interpretas a Gelman respecto a la elección de la Gamma para el parámetro de escala. La base del modelado jerárquico es relacionar parámetros individuales con uno común a través de una estructura con parámetros desconocidos (típicamente media y varianza). En este sentido, utilizar una distribución gamma para la varianza individual (o lognormal para la cola más pesada) condicionada a la varianza media y su dispersión me parece válido (al menos en lo que respecta a los argumentos de Gelman).

Las críticas de Gelman sobre la gamma para el parámetro de escala se refieren al hecho de que la gamma se utiliza para aproximar el Jeffreys fijando valores extremos a su parámetro. El problema es que dependiendo de lo extremos que sean estos valores (lo cual es bastante arbitrario) la posterior puede ser muy diferente. Esta observación invalida el uso de esta prior, al menos cuando no tenemos información para fijar en la prior. En su discusión, me parece que la gamma o la gamma inversa nunca se calibra en términos de media y varianza a partir de información a priori o de una estructura jerárquica. Así que su recomendación se refiere a un contexto bastante diferente del tuyo que, si entiendo bien tu propósito, consiste en utilizar una estructura jerárquica a priori que relaciona la varianza individual a través de una estructura cuyos parámetros de media y varianza también se estiman.

0voto

Professor Mant Puntos 1

Gelman esboza brevemente los problemas que plantea el uso de las distribuciones Gamma como vago (utiliza la palabra no informativo ) para la varianza. Por el contrario, tu problema (y el ejemplo de Kruschke) parece referirse al caso en el que existe algún conocimiento sobre la varianza. Observe también que la imagen de la distribución de la varianza $\tau_i$ no es plana en absoluto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X