15 votos

¿Por qué concluir CNNs con capas FC?

Desde mi entendimiento, CNNs constan de dos partes. La primera parte (capas conv/piscina) que hace la extracción de la característica y la segunda parte (fc capas) que hace la clasificación de las características.

Ya completamente conectado redes de los nervios no son los mejores clasificadores (es decir, que consiguen superó por MVS y RFs la mayoría del tiempo), ¿por qué CNNs concluir con capas FC, en lugar de digamos un SVM o un RF?

5voto

ssn Puntos 472

No es tan simple. Primero de todo, una SVM es, en cierto modo, un tipo de red neuronal (usted puede aprender una SVM solución a través de retropropagación). Ver Lo que *es* una Red Neuronal Artificial?. En segundo lugar, usted no puede saber de antemano cuál es el modelo que va a funcionar mejor, pero la cosa es totalmente neuromorphic de la arquitectura, usted puede aprender los pesos de extremo a extremo, mientras que la fijación de un SVM o RF a la última capa oculta de la activación de la CNN es un simple ad hoc procedimiento. Puede funcionar mejor, y puede que no, no podemos saberlo sin necesidad de pruebas.

La parte importante es que totalmente convolucional de la arquitectura es capaz de representación de aprendizaje, que es útil para una miríada de razones. Por una vez, puede reducir o eliminar la función de la ingeniería del todo en su problema.

Acerca de la FC capas, que son matemáticamente equivalentes a 1x1 Convolucional capas. Ver Yann Lecun del post, que me transcripción a continuación:

En Convolucional Redes, no hay tal cosa como "totalmente conectado capas". Sólo hay convolución capas con 1x1 de convolución núcleos y una completa tabla de conexión.

Es un muy rara vez entendido hecho de que ConvNets no es necesario tener un tamaño fijo de entrada. Usted puede entrenar con ellos en las entradas que suceder para producir un único vector de salida (sin extensión espacial) y, a continuación, aplicarlos para imágenes de mayor tamaño. En lugar de un único vector de salida, a continuación, obtener una mapa espacial de la salida de los vectores. Cada vector ve de entrada de windows en diferentes lugares en la entrada.

En ese escenario, el "totalmente conectado capas" realmente actuar como 1x1 las circunvoluciones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X