2 votos

¿en qué se parece este diseño de cuello de botella al bloque residual original de resnet?

Este papel/enlace habla del diseño del cuello de botella de Resnet.

enter image description here No me queda nada claro cómo el diseño del cuello de botella de la derecha es equivalente al del diagrama de la izquierda y cómo reduce los parámetros. El de la izquierda tiene una entrada de 64 d, mientras que el de la derecha tiene 256 d. ¿Qué significa "d"? Si es el canal de entrada, ¿qué significa 64 en '1x1, 64'? Si la entrada a conv 1x1 es de 256 canales, entonces no significa implicitamente, que tenemos un filtro de 1x1x256 para la conv? Asi que no estoy seguro, de donde viene ese 64.

En resumen, no está muy claro cómo el lado izquierdo es equivalente al diagrama de cuello de botella de la derecha y cómo el derecho es mejor. ¿Podría alguien explicarlo?

2voto

mclaughlinj Puntos 1099

No son equivalentes, la afirmación es simplemente que el bloque de la derecha tiene más expresividad a la vez que es más eficiente desde el punto de vista computacional.

El número de parámetros de cada capa puede calcularse como $NMK^2$ donde el núcleo es $K \times K$ y hay $N$ entrada y $M$ canales de salida. Así, el bloque izquierdo tiene unos 74.000 parámetros y el derecho, 70.000.

d denota los canales en la salida de cada capa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X