He encontrado que Imagenet y otros grandes de la CNN hace uso de la respuesta local de la normalización de las capas. Sin embargo, no puedo encontrar mucha información sobre ellos. ¿Qué tan importantes son y cuándo se deben usar?
De http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers:
"La respuesta local de la normalización de la capa realiza una especie de "lateral la inhibición" por la normalización de más de entrada local de las regiones. En ACROSS_CHANNELS modo, el local de las regiones que se extienden a través de cerca de los canales, pero no tienen el alcance espacial (es decir, tienen forma local_size x 1 x 1). En WITHIN_CHANNEL modo, las regiones locales se extienden espacialmente, pero en canales separados (es decir, tienen la forma 1 x local_size x local_size). Cada valor de entrada es dividido por (1+(α/n)∑ix2i)β, donde n es el tamaño de cada local de la región, y la suma se toma sobre la región centrada en ese valor (cero relleno se añade si es necesario)."