En el documento de Ackley y Hinton "Un algoritmo de aprendizaje para las máquinas de Boltzmann" escriben que
Se necesitaría una unidad oculta, por ejemplo, si el entorno exigiera que los estados de tres unidades visibles tengan una paridad uniforme, una regularidad que no se puede imponer sólo con las interacciones interacciones por pares.
¿Podría alguien explicar cómo una unidad oculta hace cumplir esta restricción de paridad? Me cuesta ver cuál sería la estructura y los pesos de la red. (En general, veo intuitivamente por qué las unidades ocultas añaden potencia, pero no tengo una comprensión rigurosa).