En su libro de texto, Modelos gráficos, familias exponenciales e inferencia variacional , M. Jordan y M. Wainwright discutir la conexión entre Familias exponenciales y Campos aleatorios de Markov (modelos gráficos no dirigidos).
Estoy tratando de entender mejor la relación entre ellos con las siguientes preguntas:
- ¿Son todos los MRF miembros de las familias exponenciales?
- ¿Pueden representarse todos los miembros de las familias de Exponential como un MRF?
- Si las MFRs $\neq$ Familias exponenciales, ¿cuáles son algunos buenos ejemplos de distribuciones de un tipo no incluidas en el otro? ?
Por lo que entiendo en su libro de texto (capítulo 3), Jordan y Wainwright presentan el siguiente argumento:
-
Digamos que tenemos una variable aleatoria escalar X que sigue alguna distribución $p$ y dibujar $n$ observaciones i.i.d. $X^1, \ldots X^n$ y queremos identificar $p$ .
-
Calculamos las expectativas empíricas de ciertas funciones $\phi_\alpha%$
$\hat{\mu}_\alpha= \frac{1}{n}\sum^n_{i=1}\phi_\alpha(X^i), $ para todos $\alpha \in \mathcal{I}$
donde cada $\alpha$ en algún conjunto $\mathcal{I}$ indexa una función $\phi_\alpha: \mathcal{X} \rightarrow R$
-
Entonces, si obligamos a que los dos conjuntos de cantidades siguientes sean coherentes, es decir, que coincidan (para identificar $p$ ):
-
Las expectativas $E_p[(\phi_\alpha(X)]=\int_\mathcal{X}\phi_\alpha(x)p(x)\nu(dx)$ de las estadísticas suficientes $\phi$ de la distribución $p$
-
Las expectativas bajo la distribución empírica
-
obtenemos un problema indeterminado en el sentido de que hay muchas distribuciones $p$ que son coherentes con las observaciones. Así que necesitamos un principio para elegir entre ellas (para identificar $p$ ).
Si utilizamos el principio de máxima entropía para eliminar esta indeterminación, podemos obtener un único $p$ :
$\DeclareMathOperator*{\argmax}{arg\,max} p^* = \argmax_{p\in{\mathcal{P}}} \,H(p)$ con sujeción a $E_p[(\phi_\alpha(X)] = \hat{\mu}_\alpha$ para todos $\alpha \in \mathcal{I}$
donde este $p^*$ tiene la forma $p_\theta(x) \propto $ exp ${\sum_{\alpha \in \mathcal{I}}\theta_\alpha \phi_\alpha(x)},$ donde $\theta \in R^d$ representa una parametrización de la distribución en forma de familia exponencial.
En otras palabras, si
- Hacer que las expectativas de las distribuciones sean consistentes con las expectativas bajo la distribución empírica
- Utilizar el principio de máxima entropía para deshacerse de la indeterminación
$\rightarrow$ Terminamos con una distribución de la familia exponencial.
Sin embargo, esto parece más bien un argumento para introducir familias exponenciales, y (por lo que puedo entender) no describe la relación entre las MRF y las familias exp. ¿Me estoy perdiendo algo?