Retropropagación en la capa de convolución

Question

Retropropagación en la capa de convolución

Preguntado el 12 de Agosto, 2018: Cuando se hizo la pregunta
5062 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

La mayoría de los ejemplos que encontré en Internet explican bien la retropropagación en la capa de convolución, pero solo con un único kernel y un único canal de entrada.

No entiendo cómo hacer la retropropagación para más de un kernel y más de un canal de entrada.

Supongamos que tengo una capa de convolución que acepta una entrada $X$ de tamaño 3x20x20, aplica 5 filtros de kernel 3x3x3 $K$ y produce una salida $O$ de tamaño 5x18x18

En un diagrama se ve así (pido disculpas por mi horrible dibujo a mano):

Durante la pasada hacia atrás, la capa recibe un error $\frac{\partial E}{\partial O}$ y lo propaga de vuelta a la capa anterior.

Según entiendo, para calcular $\frac{\partial O}{\partial X}$ necesito aplicar una convolución 'completa' a $\frac{\partial E}{\partial O}$ con kernels rotados 180°. Entonces, se ve así:

Las dimensiones de $\frac{\partial O}{\partial X}$ deberían coincidir con las dimensiones de $X$ (3x20x20), pero la operación de convolución produce una salida con una profundidad igual al número de kernels (en mi caso 5).

Mi pregunta es ¿cómo una convolución 'completa' entre $\frac{\partial E}{\partial O}$ 5x18x18 sobre 5 filtros rotados 3x3x3 puede producir una salida $\frac{\partial O}{\partial X}$ con dimensiones 3x20x20? ¿No es cierto que la profundidad de la salida de la operación de convolución es igual al número de filtros?

Preguntado el 12 de Agosto, 2018 por Daniel Trebbien

Answer 1

1 Respuestas

Answer 2

6voto

Dox Puntos 161

Intento explicar las dimensiones obtenidas (5x18x18 -> 3x20x20):

5 -> 3 las convoluciones invertidas se repiten 3 veces, pero los efectos de cada uno de los 5 filtros se suman, exactamente como se hace en la fase hacia adelante. En cualquier caso, en una capa convolucional es posible dar cualquier profundidad en la entrada y cualquier número de filtros en la salida también.
18 -> 20 se debe a la convolución completa, en la que se aplica un relleno a la imagen de entrada, obteniendo así una imagen más grande como resultado.

De todos modos, aquí se explica muy bien la retropropagación en capas convolucionales.

Respondido el 20 de Agosto, 2018 por Dox (161 Puntos )

Retropropagación en la capa de convolución

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Retropropagación en la capa de convolución

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: