Sí, esto es correcto. Básicamente, usted tiene
fX,Y(x,y)=fX|Y(x|y)fY(y),
y como has dicho, puedes tomar muestras de la densidad conjunta. Recogiendo sólo la x s de las muestras le lleva a una muestra de la distribución marginal.
Esto se debe a que el acto de ignorar el y es similar a integrarse sobre ella. Entendamos esto con un ejemplo.
Supongamos que X = Altura de las madres y Y = Altura de la hija. El objetivo es obtener una muestra de (X,Y) para entender la relación entre las alturas de las hijas y sus madres. (Estoy haciendo la suposición de que sólo hay una hija en la familia, y restringiendo la población a todas las hijas mayores de 18 años para asegurar el crecimiento completo).
Sales y consigues una muestra representativa (x1,y1),…,(xN,yN).
Así, para cada madre, tienes la altura de su hija. Debe haber una relación clara entre X y Y . Supongamos ahora que de su conjunto de datos, se ignoran todos los datos de las hijas (se elimina el Y ), entonces ¿qué tienes? Tienes exactamente alturas de madres elegidas al azar que serán N se nutre del marginal de X .