5 votos

Ayuda a comprender plenamente Convolucional Redes Neuronales

Acabo de empezar a aprender acerca de las Redes Neuronales (más en concreto CNNs) y me gustaría aclarar algunos puntos.
He estado usando este tutorial para las Redes Neuronales y esta a la CNN.

Ahora creo que entiendo cómo Convolución, ReLU y la Agrupación son matemáticamente hecho, pero no puedo entender algunos otros pasos a través de la CNN proceso:

Supongamos que tenemos 1 imagen de entrada y 4 filtros para la primera de convolución.

Después de la primera circunvolución, ¿cómo vamos de 4 mapas de características a un mayor número de mapas de características? He visto ejemplos en los que vamos a partir de 4 mapas a 6 mapas, que no tiene ningún sentido para mí. También hay este Link con un ejemplo visual, pero no puedo entender cómo ir desde los 6 Mapas de 16 Mapas en la Convolución de la Capa 2 (esta pregunta también fue preguntado AQUÍ con más detalles, pero sin respuesta que pude entender)

2voto

user432528 Puntos 11

Cada filtro en un convolucional capa se debe tener la misma profundidad que el volumen de entrada, pero usted es libre de elegir el número total de filtros que se utilizan en la capa. Pasando de 4 mapas a 6 mapas podría lograrse mediante el uso de 6 filtros, cada uno de los cuales era de profundidad 4. Cada filtro que se usa en un convolucional capa corresponde a otro "sector" (en la dimensión de la profundidad) de la salida de volumen de la capa.

0voto

James Puntos 26

Usted debe estar familiarizado con completamente conectado a las redes neuronales, donde los pesos entre la capa de la $N$ nodos de entrada y $M$ nodos ocultos se almacenan en un $N$ $M$ matriz.

Con convolucional las redes neuronales, los pesos son almacenados en un $W$ $H$ $C$ $D$ tensor (4d matriz) donde $W$ es el ancho de la ventana de convolución, $H$ es su altura, y $C$ es su profundidad. Los primeros 3 dimensiones ($W$, $H$, $C$) son todos de entrada dimensiones. Así que imagínense como un muy elegante a $N$. La primera capa oculta, (capa de filtros), también tiene 3 dimensiones, permite llamar $W_2$, $H_2$ y $D$. $W_2$ y $H_2$ son calculados basados en $W$$H$, así que usted puede elegir, pero usted puede elegir el $D$ que será la profundidad de la primera capa oculta de los filtros. Así que piensa en $W_2$, $H_2$ y $D$ como una fantasía $M$.

En tu ejemplo, para obtener a partir de los 4 mapas de características a 6 mapas de características, $C=4$$D=6$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X