Sin embargo, esta es una cuestión interesante, sí que falta una aclaración adecuada de lo que se considera un red neuronal convolucional .
¿Es el único requisito que la red debe incluir ¿una operación de convolución? ¿Tiene que sólo incluyen ¿Operaciones de convolución? ¿Se admiten las operaciones de agrupación? Las redes convolucionales utilizadas en la práctica utilizan una combinación de operaciones, que a menudo incluyen capas totalmente conectadas (en cuanto se tiene una capa totalmente conectada, se tiene la capacidad teórica de aproximación universal).
Para darle alguna respuesta, considere el siguiente caso: Una capa totalmente conectada con $D$ entradas y $K$ se realiza mediante una matriz de pesos $W \in \mathbb R ^{K\times D} $ . Se puede simular esta operación utilizando 2 capas de convolución:
-
El primero tiene $K\times D$ filtros de forma $D$ . Elemento $d$ del filtro $k,d$ es igual a $W_{k,d}$ El resto son ceros. Esta capa transforma la entrada en $KD$ -espacio intermedio de dimensiones donde cada dimensión representa un producto de un peso y su correspondiente entrada.
-
La segunda capa contiene $K$ filtros de forma $KD$ . Elementos $kD\ldots(k+1)D$ del filtro $k$ son unos, el resto son ceros. Esta capa realiza la suma de los productos de la capa anterior.
Esta red convolucional simula una red totalmente conectada y, por tanto, tiene la misma capacidad de aproximación universal. Es usted quien debe considerar la utilidad de este ejemplo en la práctica, pero espero que responda a su pregunta.