9 votos

Asesoramiento en análisis de sensibilidad para priores en estadística bayesiana

No estoy claro sobre cómo realizar análisis de sensibilidad sobre los priores. Muchos sitios tienen diferentes respuestas. Un sitio indica a realizar tres no informativo, débilmente informativo y conocido de los priores. Otra sugieren que el funcionamiento del modelo con diferentes prioridades.

Aquí están mis preguntas:

Quiero estimación de este parámetro, en el cual A = media 1 + media2 . Así, los priores de media 1 y media2 están formulados (en la codificación) como el siguiente :

mean1 ~ N(u1, tau1)
A ~ N(mean1, tau2) 

donde

tau1 ~ gamma(alpha1,beta1)
tau2 ~ gamma(alpha2,beta2)

Con la anterior formulación, ¿cómo se realiza el análisis de sensibilidad?

  1. Debo definir un rango de u1, tau1, y tau2 ? Si es así, ¿cuál es la sistemática de los procedimientos? A mí me parece que hay varios combinaciones: variables u1 y la fijación de tau1 y tau2; o revisión u1 y tau2, variando tau1; o revisión u1 y tau1, variando tau2. ¿Cómo podemos saber cuáles son los correctos priores a utilizar?

  2. ¿Cómo puedo incorporar débilmente informativo de los priores a la anterior formulación?

  3. ¿Qué pasa si la prueba de sensibilidad de la devuelve diferentes estimado de media 1 y por la variación de los priores? ¿Cómo hacer que la conclusión?

Su consejo será apreciado y ayudarme a empezar. Gracias!

EDIT: he corregido un error. Usted puede calcular la estimación de la media 2 de parámetros estimados Una y estimado de la media 1.

7voto

Steve Puntos 477

Que lo intentara, yo soy incapaz de encontrar una fuente abierta que explica en detalle ese proceso, por lo que para una más tratamiento que el de abajo, yo estoy a la izquierda para dirigir su Bayesiano de Análisis de Datos. En particular, Ch. 6 debería resultar muy útil.

En el más amplio de los trazos, tras el análisis de uno debería reflexionar sobre si el modelo de inferencias hacer un sentido realista. Por ejemplo, considere este documento detallando consideraciones previas en un estudio farmacológico. En breve, el tamaño del hígado fue una variable relevante para el modelo, sobre el cual mucho de lo que se conoce en la literatura médica:

Por ejemplo, el parámetro 8 representa la masa del hígado como una fracción de la masa magra del cuerpo; de los anteriores estudios médicos, el hígado se sabe que aproximadamente el 3,3% de la masa corporal magra para hombres adultos jóvenes, con poca variación.

No informativo antes hubiera sufrido un par de trampas:

Si noninformative antes de distribuciones asignados a todos los parámetros individuales, entonces el modelo se ajuste a los datos muy de cerca, pero con científicamente razonable parámetros – por ejemplo, una persona con un hígado pesa 10 k. Este tipo de dificultad es lo que motiva a un investigador para especificar una distribución previa el uso de información externa.

Esto es una simple prueba de realismo: Si su modelo sugiere un hígado humano del tamaño de un pavo de accion de gracias, hay un error de algún tipo.

Mientras no bien aplicada para el problema, en este ejemplo deja claro lo mucho que estas consideraciones depender del contexto. Para examinar si la parte posterior es muy dependiente de la anterior, se puede considerar que varios de los priores y ver si la parte posterior de los cambios, en un sentido práctico, como diferentes de los priores necesariamente tendrá que ceder siempre diferente posteriores. Por ejemplo, digamos que usted está sondeo de un electorado acerca de la compatibilidad de un proyecto de ley. En particular, nadie ha recogido datos sobre esta población por el apoyo de esta ley: los datos existentes en un conocimiento vacío.

Construir un modelo en el que cada persona de forma aleatoria encuesta es una variable aleatoria de Bernoulli con parámetro de $\theta \le 1$. Selecciona la distribución beta como una conveniencia antes de $\theta$, porque es conjugado a la de Bernoulli. Has encuestados 98 seleccionados al azar de las personas, de los cuales 45 apoyo a la medida. Pero usted se pregunta si el Jeffrey previa, $B(\frac{1}{2}, \frac{1}{2})$ o una densidad uniforme sobre $[0,1]$, dado por $B(1,1)$. Dejando las matemáticas formal a un lado, los respectivos posteriores se $B(45.5, 53.5)$$B(46, 54)$, y es difícil ver esta diferencia podría ser de consecuencias prácticas:

Two beta distributions B(45.5, 53.5) and B(46, 54) in green and blue, respectively

(Tenga en cuenta que las líneas azul y verde son casi indistinguibles.) Ahora, usted puede imaginar que si uno tenía la anterior, a la extensa datos de las encuestas sobre esta propuesta, entonces tal vez estos datos podrían indicar un cambio de opinión, un status quo resultado, o el ruido aleatorio. En ese caso, sería prudente comparar estas inferencias con la derivada de más informado de los priores.

Ahora, a sus preguntas específicas sobre:

  1. Los parámetros de interés debe tener siempre una determinada distribución y antes, no sea que uno no podía hacer inferencias sobre ellos en todo. A la pregunta de corregir los priores, que de nuevo depende del estado del conocimiento del problema, y tal vez lo que priores su audiencia escéptica se encuentran conformes. Si el conocimiento es escaso, puede que desee considerar la posibilidad de que los informativos de los priores. Pero cualquier elección de antes, o la opción de fijar un parámetro, debe ser justificada, ya sea a partir de los conocimientos existentes o la incertidumbre.
  2. Simplemente derivar posteriores de cualquiera de los priores desea considerar, compararlos para examinar si la diferencia es de importancia para el problema en cuestión.
  3. Ese es el más difícil, ya que depende totalmente de contexto. Si alguna de las anteriores produce un pavo de hígado de inferencia de tipos, es probablemente seguro para descartar. Pero para los más sutiles distinciones, soy consciente de que no hay sustituto para el conocimiento experto de la materia, de un cuidadoso análisis, y más datos. Factores de Bayes se utiliza a menudo en la comparación de modelos, pero en general, cuando se comparan modelos de distintas formas. (He honestamente nunca consideró a los factores de Bayes para comparar los priores, pero mi sensación es que un factor de Bayes análisis estaría a favor de la brumoso antes, es decir, la que le dio más peso a los datos).

Espero que esto ayude!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X