Me cuesta establecer la conexión matemática entre una red neuronal y un modelo gráfico.
En los modelos gráficos, la idea es sencilla: la distribución de probabilidad se factoriza en función de las camarillas del grafo, y los potenciales suelen ser de la familia exponencial.
¿Existe un razonamiento equivalente para una red neuronal? ¿Se puede expresar la distribución de probabilidad sobre las unidades (variables) en una máquina de Boltzmann restringida o una CNN como una función de su energía, o del producto de las energías entre unidades?
Además, ¿la distribución de probabilidad modelada por un RBM o una red de creencia profunda (por ejemplo, con CNNs) es de la familia exponencial?
Espero encontrar un texto que formalice la conexión entre estos tipos modernos de redes neuronales y la estadística de la misma manera que Jordan & Wainwright hicieron para los modelos gráficos con su Modelos gráficos, familias exponenciales e inferencia variacional . Cualquier consejo sería estupendo.