En el sitio web de CRF++ http://crfpp.sourceforge.net/ mencionan que se pueden obtener probabilidades marginales para cada etiqueta posible. Mi pregunta es, en la teoría de CRF, ¿cuál es la fórmula para esta probabilidad marginal? Creo que es:
$$p_{_\theta}(Y_{_j} = y | X ) = \frac{\alpha_{_j}(y|X)\beta_{_j}(y|X)}{Z_{_\theta}(X)}$$
donde Yj es una sebecuencia de Y, que es la secuencia de etiquetas, condicionada a la variable observada X, y Z(X) es una función de normalización de X, y y son las probabilidades hacia delante y hacia atrás utilizadas en los algoritmos forward-backward.
¿Es esto correcto?