RNN puede ser utilizado para la predicción, o la secuencia de la secuencia de asignación. Pero, ¿cómo puede RNN ser utilizados para la clasificación? Quiero decir, nos dan toda una secuencia de una etiqueta.
Respuestas
¿Demasiados anuncios?Uno puede utilizar RNN para asignar varias de entrada para una sola entrada (etiqueta), como de esta figura (fuente) ilustra:
Cada rectángulo es un vector y flechas representan las funciones (por ejemplo, la matriz de multiplicar). Vectores de entrada están en rojo, la salida de los vectores están en azul y verde vectores de mantener la RNN del estado (más sobre esto en breve). De izquierda a derecha: (1) de Vainilla modo de procesamiento sin RNN, de tamaño fijo de entrada de tamaño fijo de salida (por ejemplo, la clasificación de la imagen). (2) Secuencia de salida (por ejemplo, la imagen de la subtitulación toma una imagen y salidas de una frase de palabras). (3) la Secuencia de entrada (por ejemplo, análisis de sentimiento, donde una frase determinada se clasifica como una expresión positiva o negativa sentimiento). (4) la Secuencia de entrada y la secuencia de salida (por ejemplo, la Máquina de Traducción: RNN lee una frase en inglés y, a continuación, genera una frase en francés). (5) Sincronizado de la secuencia de entrada y de salida (por ejemplo, el vídeo de la clasificación donde queremos etiqueta de cada fotograma de vídeo). Observe que en cada caso hay pre-restricciones especificadas en las longitudes de las secuencias, ya que el recurrente transformación (verde) es fijo y se puede aplicar tantas veces como queramos.
En caso de simple RNN, alimentar a toda la secuencia de su red y, a continuación, la salida de la clase de la etiqueta en el último elemento de la secuencia (ver este artículo y las referencias allí por ejemplo temprano de este enfoque). En la fase de entrenamiento podemos backpropogate error en el tiempo desde el último elemento de la secuencia para el inicio de la secuencia. En general, esto no es diferente de la RNN secuencia de etiquetado problema, donde tenemos que asignar etiquetas sólo a algunos de los elementos de la secuencia (o de todos los demás elementos son etiquetados como OTROS).