Estoy tratando de entender la semi de aprendizaje supervisado en el paseo aleatorio. Digamos que tengo 10 clases y tengo algunos etiquetados y no etiquetados puntos. Ahora, necesito encontrar en las etiquetas para los sin etiquetar los puntos de uso semi-supervisado de aprendizaje en paseo aleatorio.
Podemos definir la matriz de transición P de los nodos o elementos de tal manera que cada entrada de $P_{ij}$ da la probabilidad de moverse desde el nodo i al j. Ahora, dado que yo pueda propagar las etiquetas. Si P es la matriz de transición, que puede tener P resetted a
P = $$P_{ll} P_{lu}$$ $$P_{ul} P_{uu}$$
y si Y representa una matriz de distribuciones de probabilidad sobre el conjunto de la etiqueta, a continuación, puede utilizar el siguiente algoritmo iterativo para obtener las etiquetas para los no etiquetados puntos. Vamos a decir $Y_l$ el conjunto de marcados los puntos y $Y_u$ el conjunto de los no etiquetados puntos para los que tenemos que encontrar las etiquetas. Permite que dice que hay diez etiquetados puntos otorgados por los 10 etiquetas y tengo que encontrar las etiquetas para el resto de los 100 puntos digamos, entonces no es de este algoritmo iterativo
$Y^{0} \leftarrow Y$
$t \leftarrow 1$
repita
$Y^{t} \leftarrow PY^{t-1}$
$Y_{l}^{t} \leftarrow Y_{l}$
hasta la convergencia a $Y^\inf$
$\tilde{Y} \leftarrow Y^{inf}$
Yo no entiendo cómo inicializar este vector en el principio. Digamos que tengo 110 puntos dados. He etiqueta 1.2.3...10 para la decena de puntos, entonces ¿cómo voy a inicializar este Y de la matriz y en el final cuando llego a $\tilde{Y}$ ¿cómo puedo saber que clase a la que pertenece. Me refiero a que voy a tener unos valores. ¿Cómo voy a saber que clase de el sin etiquetar los puntos de $\tilde{Y}$ pertenecen. Si hubiera sido binario me hubiera conocido, porque si el valor era mayor que 0.5, me han dicho que pertenece a la clase 1 caso contrario 0. Pero lo que en el caso cuando tengo diez etiquetas.