De hecho estoy dudando preguntar esto, porque me temo que me va a ser transferido a otras preguntas o Wikipedia sobre el muestreo de Gibbs, pero no tengo la sensación de que ellos describen lo que está a mano.
Dada una probabilidad condicional $p(x|y)$: $$ \begin{array}{c|c|c} p(x|y) & y = y_0 & y = y_1 \\ \hline x = x_0 & \tfrac{1}{4} & \tfrac{2}{6} \\ \hline x = x_1 & \tfrac{3}{4} & \tfrac{4}{6} \\ \end{array} $$
Y una probabilidad condicional $p(y|x)$: $$ \begin{array}{c|c|c} p(y|x) & y = y_0 & y = y_1 \\ \hline x = x_0 & \tfrac{1}{3} & \tfrac{2}{3} \\ \hline x = x_1 & \tfrac{3}{7} & \tfrac{4}{7} \\ \end{array} $$
Podemos únicamente con la probabilidad conjunta $f_{unique}=p(x,y)$:
$$ \begin{array}{c|c|c|c} p(x,y) & y = y_0 & y = y_1 & p(x) \\ \hline x = x_0 & a_0 & a_1 & c_0 \\ \hline x = x_1 & a_2 & a_3 & c_1 \\ \hline p(y) & b_0 & b_1 & \\ \end{array} $$
Porque, aunque hemos $8$ incógnitas, tenemos más ($4*2+3$) ecuaciones lineales:
$ a_0+a_1+a_2+a_3=1 \\ b_0+b_1 = 1 \\ c_0+c_1 = 1 $
Así como:
$ \tfrac{1}{4} b_0 = a_0 \\ \tfrac{3}{4} b_0 = a_2 \\ \tfrac{2}{6} (1-b_0) = a_1 \\ \tfrac{4}{6} (1-b_0) = a_3 \\ \tfrac{1}{3} c_0 = a_0 \\ \tfrac{2}{3} c_0 = a_1 \\ \tfrac{3}{7} (1-c_0) = a_2 \\ \tfrac{4}{7} (1-c_0) = a_3 $
Rápidamente resuelto por $c_0=\tfrac{3}{4}b_0$, $\tfrac{2}{3}c_0=a_1$. Es decir, equiparando $\tfrac{2}{4}b_0=a_1$$\tfrac{2}{6}(1-b_0)=a_1$. Esto le da a $b_0=\tfrac{2}{5}$ y el resto de la siguiente manera.
$$ \begin{array}{c|c|c|c} p(x,y) & y = y_0 & y = y_1 & p(x) \\ \hline x = x_0 & \tfrac{1}{10} & \tfrac{2}{10} & \tfrac{3}{10} \\ \hline x = x_1 & \tfrac{3}{10} & \tfrac{4}{10} & \tfrac{7}{10} \\ \hline p(y) & \tfrac{4}{10} & \tfrac{6}{10} & \\ \end{array} $$
Por lo tanto, ahora vamos al caso continuo. Es imaginable para ir a intervalos y mantener la estructura anterior en el tacto (con más ecuaciones que incógnitas). Sin embargo, ¿qué sucede cuando vamos a (punto) instancias de variables aleatorias? ¿Cómo muestreo
$$ x_a \sim p(x|y=y_b) \\ y_b \sim p(y|x=x_a) $$
de forma iterativa, llevar a $p(x,y)$? Equivalente a la restricción $a_0 + a_1 + a_2 + a_3=1$, ¿cómo asegurarse de $\int_X \int_Y p(x,y) dy dx = 1$, por ejemplo? De la misma manera con $\int_Y p(y|x)dy=1$. Podemos escribir las restricciones y derivar de muestreo de Gibbs a partir de primeros principios?
Así que, no estoy interesado en la forma de realizar el muestreo de Gibbs, que es simple, pero estoy interesado en cómo obtenerlo, y preferiblemente cómo probar que funciona (probablemente bajo ciertas condiciones).