40 votos

¿Qué significa el tamaño del kernel?

Cuando la gente habla sobre redes neuronales, ¿a qué se refieren cuando dicen "tamaño del kernel"? Los kernels son funciones de similitud, ¿pero qué significa eso sobre el tamaño del kernel?

2 votos

En un contexto de CNN, a veces la gente usa "tamaño del kernel" para referirse al tamaño de un filtro convolucional, y similarmente un "kernel" es el filtro en sí mismo.

54voto

nunya Puntos 21

entrar descripción de la imagen aquí

Como se puede ver arriba, el kernel, también conocido como la matriz de kernel, es la función entre y su tamaño, aquí 3, es el tamaño del kernel (donde el ancho del kernel es igual a la altura del kernel).

Nótese que el kernel no necesariamente tiene que ser simétrico, y podemos verificarlo citando este texto de la documentación de Conv2D en Tensorflow:

kernel_size: un entero o tupla/lista de 2 enteros, especificando la altura y el ancho de la ventana de convolución 2D. Puede ser un solo entero para especificar el mismo valor para todas las dimensiones espaciales.

Pero usualmente, simplemente hacemos el ancho y la altura iguales, y si no el tamaño del kernel debería ser una tupla de 2. El kernel puede ser asimétrico, por ejemplo en Conv1D (ver este ejemplo), y el tamaño del kernel puede ser más de 2 números, por ejemplo (4, 4, 3) en el ejemplo abajo de Conv3D:

entrar descripción de la imagen aquí

Los increíbles gifs provienen de aquí y aquí.

37voto

jpmuc Puntos 4817

Las redes neuronales profundas, más concretamente las redes neuronales convolucionales (CNN), son básicamente una pila de capas que se definen por la acción de un número de filtros en la entrada. Estos filtros suelen llamarse núcleos.

Por ejemplo, los núcleos en la capa convolucional son los filtros convolucionales. En realidad, no se realiza una convolución, sino una correlación cruzada. El tamaño del núcleo aquí se refiere al ancho x alto de la máscara del filtro.

La capa de agrupación máxima, por ejemplo, devuelve el píxel con el valor máximo de un conjunto de píxeles dentro de una máscara (núcleo). Ese núcleo se barre a través de la entrada, realizando un subsampleo.

Así que no tiene nada que ver con el concepto de núcleos en máquinas de vectores de soporte o redes de regularización. Puedes pensar en ellos como extractores de características.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X