5 votos

En estadística bayesiana, ¿qué significa esta notación formal media?

He visto Bayesiano de modelos especificados como \begin{align*} Y_i|v_i &\overset{ind}{\sim} f_i(y_i|v_i),\\ v_i & \overset{ind}{\sim} g_i(v_i). \end{align*} Mi pregunta es sobre la parte superior de la línea de $Y_i|v_i\overset{ind}{\sim}f_i(y_i;v_i)$. Parece que, estrictamente hablando, esto no es matemáticamente precisa porque $Y_i$ $Y_j$ están siendo condicionado por dos variables independientes. Se me ocurren dos maneras de interpretar esta notación: $Y_i\perp Y_j|v_i,v_j$, para todos los $i,j$ o $\{Y_i\}_i$ es independiente de la familia de variables aleatorias dado el vector $\{v_i\}_i$. Yo no puedo decir si están o no en el mismo. Así son estos dos interpretaciones equivalente, y si no, cual es la correcta?

Edit: Para que quede claro, estoy confundido acerca de la "ind" por encima de la "distribuido como" signo de $\sim$ en la primera línea, dado que el condicionamiento variable tiene el subíndice $i$.

Otra posibilidad, también se me ocurrió, que es que el "ind" es redundante, y que la distribución conjunta de todos los $Y_i$ $v_i$ estaría determinado por solo escribir \begin{align*} Y_i|v_i & \sim f_i(y_i;v_i),\\ v_i & \overset{ind}{\sim} g_i(v_i), \end{align*} pero no estoy seguro de cómo demostrar. Edit: me di cuenta de que esto no puede ser cierto, porque \begin{align*} v_1, v_2 &\text{ iid } N(0, 1),\\ Y_i | v_i & \sim N(v_i, 2),\quad \text{for } i =1, 2, \end{align*} es cierto, tanto para $Y_i|v_1,v_2 \text{ iid } N(v_1+v_2,1)$, e $Y_i|v_1,v_2 \overset{ind}{\sim} N(v_i,2)$.

3voto

Dipstick Puntos 4869

Tomando el caso más sencillo

$$ v_i \desbordado{ind}{\sim} g_i(v_i) $$

presumiblemente significa que "$v_i$'s son independientemente distribuidos de acuerdo a la $g_i$ de las distribuciones de cada uno". La notación es un acceso directo para la descripción de cada una de las $i$-ésima variable como caso aparte. A menudo hay trade-off entre la simplicidad y la formalidad.

Pero la notación que usted cita es extraño, por ejemplo, pone a $v_i$ a ambos lados de $\sim$, mientras que por lo general, usted vería variable en el lado izquierdo y distribución con parámetros en el lado derecho, por lo que es redundante si se utiliza como este.

3voto

Aaron Puntos 36

Estás en lo correcto al decir que la declaración no es matemáticamente precisa; es una abreviatura que se utiliza a veces para establecer un modelo jerárquico. Yo no soy un fan de esta notación personalmente, ya que no es necesario un abuso de notación. (Prefiero especificar la independencia por separado).

Es de suponer que la intención de este tipo de declaraciones es establecer mutuamente independientes variables aleatorias con distribuciones condicionales. Implícitamente, el argumento de la variable es independiente de cualquier otra iteración del acondicionamiento de la variable no se menciona en el acondicionamiento de instrucción. Así que yo creo que la taquigrafía de la declaración,

$$Y_i|v_i \overset{ind}{\sim} f_i(y_i|v_i),$$

formalmente significa que $\{ Y_k \}$ son mutuamente independientes condicional en $\{ v_k \}$, y a cada elemento de la primera condicional distribución $Y_i | \{ v_k \} \sim f_i(v_i)$. Así que su segunda interpretación es la que yo usaría. La razón yo creo que esta es la interpretación es simplemente que usted no puede continuar con su análisis más débiles de la hipótesis. Si lo que se pretende con la notación de ciertos tipos de pares de independencia, una independencia condicional sólo en los subconjuntos de a$\{ v_k \}$, entonces no hay suficiente especificación para configurar un modelo jerárquico con una probabilidad fija de la función.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X