17 votos

¿Muestreo de la distribución marginal utilizando la distribución condicional?

Quiero hacer un muestreo de una densidad univariante $f_X$ pero sólo conozco la relación:

$$f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy.$$

Quiero evitar el uso de MCMC (directamente en la representación integral) y, como $f_{X\vert Y}(x\vert y)$ y $f_Y(y)$ son fáciles de muestrear, estaba pensando en utilizar el siguiente muestreador:

  1. Para $j=1,\dots, N$ .
  2. Muestra $y_j \sim f_Y$ .
  3. Muestra $x_j \sim f_{X\vert Y}(\cdot\vert y_j)$ .

Entonces, terminaré con los pares $(x_1,y_1),...,(x_N,y_N)$ y tomar sólo las muestras marginales $(x_1,\dots,x_N)$ . ¿Es esto correcto?

13voto

Helper Puntos 1

Sí, esto es correcto. Básicamente, usted tiene

$$f_{X,Y}(x,y) = f_{X|Y}(x|y) f_Y(y),$$

y como has dicho, puedes tomar muestras de la densidad conjunta. Recogiendo sólo la $x$ s de las muestras le lleva a una muestra de la distribución marginal.

Esto se debe a que el acto de ignorar el $y$ es similar a integrarse sobre ella. Entendamos esto con un ejemplo.

Supongamos que $X$ = Altura de las madres y $Y$ = Altura de la hija. El objetivo es obtener una muestra de $(X,Y)$ para entender la relación entre las alturas de las hijas y sus madres. (Estoy haciendo la suposición de que sólo hay una hija en la familia, y restringiendo la población a todas las hijas mayores de 18 años para asegurar el crecimiento completo).

Sales y consigues una muestra representativa $$(x_1, y_1), \dots, (x_N, y_N). $$

Así, para cada madre, tienes la altura de su hija. Debe haber una relación clara entre $X$ y $Y$ . Supongamos ahora que de su conjunto de datos, se ignoran todos los datos de las hijas (se elimina el $Y$ ), entonces ¿qué tienes? Tienes exactamente alturas de madres elegidas al azar que serán $N$ se nutre del marginal de $X$ .

1 votos

Gracias por esto, es útil. Sabe si esta estrategia de muestreo se puede relacionar con el muestreo de Gibbs para justificarla formalmente?

1 votos

Si se puede muestrear de la distribución conjunta con facilidad, entonces ignorando la $y$ para obtener el marginal para $x$ no necesita justificación. Es algo común. Tal vez, se puede decir que $y$ es un Variable de la pieza clave pero como no se necesita el muestreo de Gibbs para tomar muestras de $y$ En este caso no es necesario el MCMC.

2 votos

Greenparker, pero ¿hay alguna prueba formal de esa afirmación, es decir, que si se considera sólo una parte de la muestra tomada del conjunto se obtiene una muestra del marginal?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X