Estaba tratando de entender el algoritmo de refuerzo descrito por el Apuntes de las clases de posgrado del MIT sobre ocw .
En la página 2 dan el esquema de la potenciación de la siguiente manera:
El paso que no me queda claro es la relación marcada como ecuación (2), es decir
$$ -\sum^{n}_{t=1} \tilde{W}(t)_{m-1} y_{t}h(x; \theta_{m}) = 2 \epsilon_m -1$$
¿Por qué se mantiene esa relación? No me queda del todo claro.
Además, recuerda que $\epsilon_m$ es el error de clasificación ponderado (pérdida cero), es decir
$$ \epsilon_m = \sum^{n}_{t=1} \tilde{W} (t) _{m-1} \mathbb{1}\{ y^{(t)} \neq h(x^{(t)}; \theta_{m})\} $$
donde $\mathbb{1}\{ \cdot \} $ es la función indicadora.