Estoy tratando de entender cómo Boltzmann máquinas de trabajo, pero no estoy muy seguro de cómo pesos son aprendidas, y no he sido capaz de encontrar una descripción clara. Es la respuesta correcta? (También, los punteros a cualquier máquina de Boltzmann explicaciones también sería genial.)
Tenemos un conjunto visible de unidades (p. ej., correspondiente a negro/blanco píxeles en una imagen) y un conjunto de unidades ocultas. Los pesos se inicializan de alguna manera (por ejemplo, el uniforme de [-0.5, 0.5]) y, a continuación, que se alternan entre las siguientes dos fases, hasta que alguna de detener la regla se alcanza:
Sujeta fase En esta fase, todos los valores de la visible unidades son fijos, por lo que sólo la actualización de los estados de las unidades ocultas (de acuerdo a la Boltzmann estocástico de activación de la regla). Actualizamos hasta que la red ha alcanzado el equilibrio. Una vez que alcance el equilibrio, seguimos actualizando $N$ veces más (para algunos predefinidos $N$), seguimiento de la media de $x_i x_j$ (donde $x_i, x_j$ son los estados de los nodos de $i$$j$). Después de los $N$ equilibrio actualizaciones, actualizamos $w_ij = w_ij + \frac{1}{C} Average(x_i x_j)$ donde $C$ es algo de la tasa de aprendizaje. (O, en lugar de hacer una actualización por lotes al final, hacemos la actualización después de que nos equilibrio de paso?)
Libre de fase En esta fase, los estados de todas las unidades están actualizados. Una vez que alcance el equilibrio, hemos igualmente de continuar actualizando N' de veces más, pero en lugar de añadir las correlaciones al final, le restamos: $w_{ij} = w_{ij} - \frac{1}{C} Average(x_i x_j)$.
Así que mis preguntas principales son:
Cuando estamos en la sujeta fase, ¿tenemos que restablecer el visible unidades a uno de los patrones que queremos aprender (con cierta frecuencia que representa la importancia de que el patrón), o hemos de dejar visible de unidades en el estado en que se encontraban al final de la fase libre?
Hacemos un lote de actualización de los pesos al final de cada fase, o la actualización de las ponderaciones en cada paso equilibrio en la fase? (O, lo que es de uno, bien?)