Loading [MathJax]/jax/element/mml/optable/MathOperators.js

71 votos

¿Cuál es la definición de un "mapa de características" (también conocido como "mapa de activación") en una red neuronal convolucional?

 Introducción Antecedentes

Dentro de una red neuronal convolucional, solemos tener una estructura/flujo general que se parece a esto:

  1. imagen de entrada (es decir, un vector 2D x )

(La primera capa convolucional (Conv1) comienza aquí...)

  1. conviven un conjunto de filtros ( w1 ) a lo largo de la imagen 2D (es decir, hacer el z1 = w1*x + b1 multiplicaciones por producto de puntos), donde z1 es 3D, y b1 es el sesgo.
  2. aplicar una función de activación (por ejemplo, ReLu) para hacer z1 no lineal (por ejemplo a1 = ReLu(z1) ), donde a1 es 3D.

(La segunda capa convolucional (Conv2) comienza aquí...)

  1. convolucionar un conjunto de filtros a lo largo de las nuevas activaciones calculadas (es decir, hacer el z2 = w2*a1 + b2 multiplicaciones por producto de puntos), donde z2 es 3D, y b2 es el sesgo.
  2. aplicar una función de activación (por ejemplo, ReLu) para hacer z2 no lineal (por ejemplo a2 = ReLu(z2) ), donde a2 es 3D.

 La pregunta

La definición del término "mapa de características" parece variar de una literatura a otra. Concretamente:

  • Para la primera capa convolucional, el "mapa de características" corresponde al vector de entrada x o el producto punto de salida z1 o las activaciones de salida a1 o el "proceso" de conversión x a a1 ¿o algo más?
  • Del mismo modo, para la segunda capa convolucional, el "mapa de características" corresponde a las activaciones de entrada a1 o el producto punto de salida z2 o la activación de la salida a2 o el "proceso" de conversión a1 a a2 ¿o algo más?

Además, ¿es cierto que el término "mapa de características" es exactamente ¿es lo mismo que "mapa de activación"? (¿o en realidad significan dos cosas diferentes?)

 Referencias adicionales:

Fragmentos de Redes neuronales y aprendizaje profundo - Capítulo 6 :

*La nomenclatura se utiliza aquí de forma imprecisa. En particular, utilizo "mapa de características" para referirme no a la función calculada por la capa convolucional, sino a la activación de la salida de las neuronas ocultas de la capa. Este tipo de abuso leve de la nomenclatura es bastante común en la literatura de investigación.


Fragmentos de Visualizar y comprender Redes convolucionales por Matt Zeiler :

En este trabajo introducimos una técnica de visualización que revela los estímulos de entrada que excitan los mapas de características individuales en cualquier capa del modelo. [...] Nuestro enfoque, por el contrario, proporciona una visión no paramétrica de la invariabilidad, mostrando qué patrones del conjunto de entrenamiento activan el mapa de características. [...] a operación de contraste local que normaliza las respuestas entre los mapas de características. [...] Para examinar una activación convnet dada, ponemos todas las demás activaciones en la capa a cero y pasamos los mapas de características como entrada a la capa deconvnet adjunta. [...] La convnet utiliza no linealidades relu, que rectifican los mapas de características asegurando así que los mapas de características son siempre positivos. [...] La convnet utiliza filtros aprendidos para convulsionar los mapas de características de de la capa anterior. [...] Fig. 6, estas visualizaciones son representaciones precisas del patrón de entrada que estimula el mapa de características dado en el modelo [...] cuando las partes de la imagen de entrada original correspondientes al patrón se ocluyen, vemos una clara caída de la actividad dentro del mapa de características. [...]

Observaciones: también introduce el término "mapa de características" y "mapa de características rectificado" en la Fig. 1.


Fragmentos de Capítulo de Stanford CS231n sobre la CNN :

[...] Un escollo peligroso que se puede notar fácilmente con esta visualización es que algunos mapas de activación pueden ser todos cero para muchas entradas diferentes, lo que puede indicar filtros muertos, y puede ser un síntoma de altas tasas de aprendizaje [...] Activaciones de aspecto típico en la primera capa CONV (izquierda), y la 5ª capa CONV (derecha) de una AlexNet entrenada mirando la imagen de un gato. Cada cuadro muestra un mapa de activación correspondiente a algún filtro. Obsérvese que las activaciones son escasas (la mayoría de los valores son cero, en esta visualización mostrada en negro) y mayoritariamente locales.


Fragmentos de Guía para principiantes sobre la comprensión de las redes neuronales evolutivas

[...] Cada ubicación única en el volumen de entrada produce un número. Después de deslizar el filtro sobre todas las localizaciones, descubrirás que lo que te queda es una matriz de 28 x 28 x 1 números, que llamamos mapa de activación o mapa de características.

62voto

Richard Huber Puntos 21

Un mapa de características, o mapa de activación, son las activaciones de salida para un filtro determinado (a1 en su caso) y la definición es la misma independientemente de la capa en la que se encuentre.

Mapa de características y mapa de activación significan exactamente lo mismo. Se llama mapa de activación porque es un mapeo que corresponde a la activación de diferentes partes de la imagen, y también un mapa de características porque también es un mapeo de dónde se encuentra un determinado tipo de característica en la imagen. Una activación alta significa que se ha encontrado una determinada característica.

Un "feature map rectificado" no es más que un feature map creado con Relu. Es posible que se utilice el término "mapa de características" para el resultado de los productos de puntos (z1), ya que en realidad también es un mapa de dónde se encuentran ciertas características en la imagen, pero eso no es común de ver.

27voto

Wouter Puntos 151

enter image description here

En la terminología de la CNN, la matriz de 3×3 se denomina "filtro" o "núcleo" o "detector de características" y la matriz que se forma al deslizar el filtro sobre la imagen y calcular el producto de puntos se denomina "Característica Convuelta" o "Mapa de Activación" o "Mapa de Características". Es importante señalar que los filtros actúan como detectores de características a partir de la imagen de entrada original.

fuente : https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/

5voto

Waqas Khan Puntos 71

Antes de hablar de lo que significa el mapa de características, vamos a definir el término de vector de características.

El vector de características es una representación vectorial de los objetos. Por ejemplo, un coche puede ser representado por [número de ruedas, puerta. ventanas, edad ..etc].

El mapa de características es una función que toma vectores de características en un espacio y los transforma en vectores de características en otro. Por ejemplo, dado un vector de características [volumen, peso, altura, anchura] puede devolver [1, volumen/peso, altura * anchura] o [altura * anchura] o incluso sólo [volumen].

2voto

Antonin GAVREL Puntos 266

Para dar una respuesta completa, necesitamos algunas definiciones:

Definiciones de fondo:

  • Para nosotros, un "espacio de entrada" X es sólo un espacio métrico.
  • Una clase de modelo F (de funciones continuas) es universal desde X a RD si F es denso en C(X,RD) para el convergencia uniforme en topología compacta.

Definición de un mapa de características:

Un mapa de características depende implícitamente de la clase de modelo de aprendizaje utilizado y del "espacio de entrada" X donde los datos se encuentran . Más formalmente, si F es una clase de modelos de Rd a RD entonces un mapa de características para F en un espacio de entrada X es una función (justa) ϕ:XRd.


¿Para qué sirve un mapa de características?

  1. El (primer) punto aquí es que ϕ hace que los datos en X compatible con el modelo de aprendizaje en F ; es decir: \mathcal{F}_{\phi}\triangleq \{\hat{f}\circ \phi:\, f\in \mathcal{F}\} no es un conjunto de modelos de \mathcal{X} a \mathbb{R}^D .

¿Qué es un "buen" mapa de características?

  1. El (segundo) punto es que una "buena" elección de un mapa de características (incluso en el caso de que \mathcal{X}=\mathbb{R}^d ) puede mejorar estrictamente la expresividad de la clase de modelo \mathcal{F} . Esto significa que:

a. (Mejora de la propiedad) \mathcal{F} es "universal" entonces también lo es \mathcal{F}_{\phi}

b. (Propiedad de la Invarianza UAP) si \mathcal{F} es "universal" entonces también lo es \mathcal{F}_{\phi} .


Revisión de la literatura sobre la construcción de "buenos mapas de características":

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X