En los modelos gráficos se tiende a explotar la independencia condicional para factorizar la probabilidad y simplificar el problema. Por simplificar me refiero a que la dimensión se reduce debido a la factorización. Por ejemplo:
Considere 3 variables aleatorias $y1,y2$ y $y3$ y considerar la estructura del grafo $$y1 \rightarrow y3 \leftarrow y2$$
En este caso podemos escribir la densidad conjunta $$f(y1,y2,y3)=f(y1)f(y2)f(y3|y1,y2)$$ Tal factorización nos permite optimizar los factores $\Big((f(y1);f(y2);f(y3|y1,y2)\Big)$ Esta factorización reduce en gran medida la dimensionalidad del problema.
¿Y si los factores, por ejemplo $f(y1)$ y $f(y3|y1,y2)$ tienen parámetros compartidos. En este caso no podemos maximizar la probabilidad conjunta mediante la maximización de cada factor por separado. ¿Cuáles son las aproximaciones utilizadas en estos casos? ¿Cuáles son algunos de los documentos o palabras clave que se utilizan para realizar esta tarea?