7 votos

La confusión relativa a la semisupervised de aprendizaje en paseo aleatorio

Estoy tratando de entender la semi de aprendizaje supervisado en el paseo aleatorio. Digamos que tengo 10 clases y tengo algunos etiquetados y no etiquetados puntos. Ahora, necesito encontrar en las etiquetas para los sin etiquetar los puntos de uso semi-supervisado de aprendizaje en paseo aleatorio.

Podemos definir la matriz de transición P de los nodos o elementos de tal manera que cada entrada de $P_{ij}$ da la probabilidad de moverse desde el nodo i al j. Ahora, dado que yo pueda propagar las etiquetas. Si P es la matriz de transición, que puede tener P resetted a

P = $$P_{ll} P_{lu}$$ $$P_{ul} P_{uu}$$

y si Y representa una matriz de distribuciones de probabilidad sobre el conjunto de la etiqueta, a continuación, puede utilizar el siguiente algoritmo iterativo para obtener las etiquetas para los no etiquetados puntos. Vamos a decir $Y_l$ el conjunto de marcados los puntos y $Y_u$ el conjunto de los no etiquetados puntos para los que tenemos que encontrar las etiquetas. Permite que dice que hay diez etiquetados puntos otorgados por los 10 etiquetas y tengo que encontrar las etiquetas para el resto de los 100 puntos digamos, entonces no es de este algoritmo iterativo

$Y^{0} \leftarrow Y$

$t \leftarrow 1$

repita

$Y^{t} \leftarrow PY^{t-1}$

$Y_{l}^{t} \leftarrow Y_{l}$

hasta la convergencia a $Y^\inf$

$\tilde{Y} \leftarrow Y^{inf}$

Yo no entiendo cómo inicializar este vector en el principio. Digamos que tengo 110 puntos dados. He etiqueta 1.2.3...10 para la decena de puntos, entonces ¿cómo voy a inicializar este Y de la matriz y en el final cuando llego a $\tilde{Y}$ ¿cómo puedo saber que clase a la que pertenece. Me refiero a que voy a tener unos valores. ¿Cómo voy a saber que clase de el sin etiquetar los puntos de $\tilde{Y}$ pertenecen. Si hubiera sido binario me hubiera conocido, porque si el valor era mayor que 0.5, me han dicho que pertenece a la clase 1 caso contrario 0. Pero lo que en el caso cuando tengo diez etiquetas.

1voto

TREE Puntos 513

Tener en cuenta que han $n$ puntos de datos (o ejemplos) de los cuales, $l$ son etiquetados y $u$ no tienen etiqueta con $l \ll n$$ n = l + u $. También, suponga que usted ha $m$ de las clases. Nos deja asignar un $m$-dimensiones de la etiqueta de vector $\mathbf{y}_i \in [1, 0]^m$ con los datos del punto de $i$. Se puede interpretar el $j$ésimo elemento de a $\mathbf{y}_i$ como la probabilidad de que el punto de $i$ pertenecientes a la clase $j$. Para el etiquetado de los ejemplos, se puede establecer $y_{ij} = 1.0$ si $j$ es la etiqueta y la $0$ lo contrario. Para los ejemplos no etiquetados, en teoría, realmente no importa lo que inicializar. Deje $\mathbf{Y} \in [0, 1]^{n\times m}$ representa a la etiqueta de vectores para el conjunto de datos completo (con y sin etiqueta). Además, vamos a utilizar un superíndice notación $\mathbf{Y}^{(k)}$ para denotar esta etiqueta de la matriz de iteración $k$.

Podemos empezar con $\mathbf{Y}^{(0)}$ como se describió anteriormente. El poder-iteración del método nos permite calcular el valor de esta etiqueta de la matriz en la iteración $t+1$ de su valor en la iteración $t$ como sigue:

$\mathbf{Y}^{(t+1)} = \mathbf{P}\mathbf{Y}^{(t)}$

Deje $\hat{\mathbf{Y}}$ ser el valor de esta etiqueta de la matriz después de convergencia o, como es la práctica, después de un número finito de iteraciones. El $i$th fila de esta matriz representa el aprendido etiqueta de vector por ejemplo,$i$, también conocida como la etiqueta de la parte posterior. La etiqueta de MAPA de asignación por ejemplo, $i$ sería:

$\hat{k} = \arg\max_{\displaystyle k} \hat{\mathbf{Y}}_{ik}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X