En el documento de DenseNet. El autor adoptó el average-pooling en las capas de transición. ¿Cuál es la motivación de esta elección? ¿Por qué no se utilizan capas de max-pooling?
Respuesta
¿Demasiados anuncios?
nunya
Puntos
21
El pooling promedio puede representar mejor la fuerza global de una característica al pasar los gradientes a través de todos los índices (mientras que el gradiente fluye sólo a través del índice máximo en el pooling máximo), lo que es muy parecido a la propia DenseNet que las conexiones se construyen entre dos capas cualesquiera.