5 votos

¿Las conexiones de acceso directo con stride > 1 siguen siendo "mapeos de identidad" en ResNets?

En Aprendizaje residual profundo para el reconocimiento de imágenes Estoy intentando comprender mejor los "atajos punteados" de la Figura 3, donde la primera capa convolucional de esos atajos se aplica con stride de 2. Entiendo la transformación lineal mediante convolución 1x1 para manejar el aumento de dimensión, es decir, la Ecn.(2). Es el stride de 2 lo que me confunde un poco conceptualmente.

Los autores afirman que "... cuando los atajos atraviesan mapas de características de dos tamaños, se realizan con un stride de 2". Implementar eso (downsampling por factor de 2) lo entiendo, pero tirar el 75% de los datos espaciales no parece que preserve el concepto de un "mapeo de identidad."

¿Estoy malinterpretando algo o estoy siendo innecesariamente riguroso al pensar en el "mapeo de identidades"?

0voto

alnorth29 Puntos 1402

Me encontré con la misma pregunta que tú y también creo que es una identidad, y no hace falta ser riguroso. A veces la forma ha cambiado, y con el fin de sumarlos, usted tiene que cambiar la forma de tensor original (o blob en caffe) mediante el ajuste de la zancada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X