9 votos

Comprensión de la distribución predictiva bayesiana

Me estoy tomando una Introducción de Bayes curso y estoy teniendo algunas dificultades para la comprensión de predicción de distribuciones. Entiendo por qué son útiles y que estoy familiarizado con la definición, pero hay algunas cosas que no acabo de entender.

1) Cómo obtener el derecho de la distribución predictiva para un vector de observaciones nuevas

Supongamos que hemos construido un modelo de muestreo $p(y_i | \theta)$ para los datos y una antes de la $p(\theta)$. Suponga que las observaciones $y_i$ son condicionalmente independientes dado $\theta$.

Hemos observado que algunos de los datos de $\mathcal{D} = \{y_1, y_2, \, ... \, , y_k\}$, y actualizamos nuestra antes de $p(\theta)$ a la parte posterior de la $p(\theta | \mathcal{D})$.

Si queremos predecir un vector de nuevas observaciones $\mathcal{N} = \{\tilde{y}_1, \tilde{y}_2, \, ... \, , \tilde{y}_n\}$, creo que debemos tratar de conseguir que la parte posterior de predicción usando esta fórmula $$ p(\mathcal{N} | \mathcal{D}) = \int p(\theta | \mathcal{D}) p ( \mathcal{N} | \theta) \, \mathrm{d} \theta = \int p(\theta | \mathcal{D}) \prod_{i=1}^n p(\tilde{y}_i | \theta) \, \mathrm{d} \theta, $$ que no es igual a $$ \prod_{i=1}^n \int p(\theta | \mathcal{D}) p(\tilde{y}_i | \theta) \, \mathrm{d} \theta, $$ para la predicción de las observaciones no son independientes, la derecha?

Decir que $\theta | \mathcal{D} \sim$ Beta($a,b$) y $p(y_i | \theta) \sim$ Binomial($n, \theta$) por un determinado $n$. En este caso, si quería simular 6 $\tilde{y}$, si lo entiendo correctamente, sería malo para simular 6 dibuja de forma independiente de la Beta-Binomial la distribución que corresponde a la parte posterior de predicción para una sola observación. Es esto correcto? No sé cómo interpretar que las observaciones no son independientes de forma marginal, y no estoy seguro de entender esto correctamente.

La simulación de la posterior predictives

Muchas veces cuando nos simular los datos de la parte posterior predictivo podemos seguir este esquema:

Para $b$ a partir del 1 de a $B$:

1) Muestra $\theta^{(b)}$$p(\theta | \mathcal{D})$.

2) Luego simular nuevos datos $\mathcal{N}^{(b)}$$p(\mathcal{N} | \theta^{(b)})$.

No sé bien cómo probar este esquema funciona, aunque parece intuitivo. También, ¿tiene un nombre? Traté de buscar una justificación y he probado diferentes nombres, pero no he tenido suerte.

Gracias!

4voto

farzad Puntos 4180

Supongamos que $X_1,\dots,X_n,X_{n+1}$ son condicionalmente independientes dado que el $\Theta=\theta$. A continuación, $$ f_{X_{n+1}\mediados de X_1,\dots,X_n}(x_{n+1}\mediados de x_1,\dots,x_n) = \int f_{X_{n+1},\Theta\mediados de X_1,\dots,X_n}(x_{n+1},\theta\mediados de x_1,\dots,x_n)\,d\theta $$ $$ = \int f_{X_{n+1}\mid\Theta,X_1,\dots,X_n}(x_{n+1}\mid\theta,x_1,\dots,x_n) f_{\Theta\mediados de X_1,\dots,X_n}(\theta\mediados de x_1,\dots,x_n) \, d\theta $$ $$ = \int f_{X_{n+1}\mid\Theta}(x_{n+1}\mid\theta) f_{\Theta\mediados de X_1,\dots,X_n}(\theta\mediados de x_1,\dots,x_n) \, d\theta \, , $$ en la que la primera igualdad se sigue de la ley de total probabilidad, el segundo se sigue de la regla del producto, y la tercera desde el supuesto de independencia condicional: dado el valor de $\Theta$, no necesitamos los valores de $X_1,\dots,X_n$ para determinar la distribución de $X_{n+1}$.

El esquema de simulación es correcta: para $i=1,\dots,N$, dibujar $\theta^{(i)}$ a partir de la distribución de $\Theta\mid X_1=x_1,\dots,X_n=x_n$, a continuación, dibuje $x_{n+1}^{(i)}$ a partir de la distribución de $X_{n+1}\mid\Theta=\theta^{(i)}$. Esto le da un ejemplo de $\{x_{n+1}^{(i)}\}_{i=1}^N$ a partir de la distribución de $X_{n+1}\mid X_1=x_1,\dots,X_n=x_n$.

1voto

iElectric Puntos 149

A tu primera pregunta: sí, las observaciones no son independientes si no sabes el valor de $\theta$. Decir, has observado que $\tilde{y}_1$ tiene valor algo extremo. Puede ser una indicación que el desconocido valor de $\theta$ sí mismo es extrema, y por lo tanto, usted debe esperar otras observaciones a ser extremo, así.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X