Así que estoy tratando de hacer pre entrenamiento en las imágenes de seres humanos, utilizando convolucional redes. He leído los papeles http://people.idsia.ch/~ciresan/datos/icann2011.pdf y http://ai.stanford.edu/~ang/papers/nips10-TiledConvolutionalNeuralNetworks.pdf Y este enlace de stackoverflow http://stackoverflow.com/questions/24752655/unsupervised-pre-training-for-convolutional-neural-network-in-theano
pero no estoy seguro de que soy comprender la estructura de las redes (que no está bien definido en los documentos).
Preguntas
-
Puedo tener mi entrada seguida de una capa de ruido seguido de un conv capa, seguido por una agrupación de capa - no después - ¿de-de la piscina antes de dar mi salida (que es la misma de mi imagen de entrada)?.
Decir que tengo varios (135,240) imágenes. Si yo uso 32, (12,21), los granos, seguido por (2,2) de la agrupación, voy a acabar con 32 (62, 110) característica de los mapas. Ahora, ¿puedo de-piscina para conseguir 32 (124, 220) característica de los mapas y luego aplanar ellos ? antes de dar mi (135,240) de la capa de salida ?
Si tengo varias conv-piscina capas, debo entrenar uno por uno - como en apiladas procesada autoencoders ? O puedo tener algo como entrada-conv-piscina-conv-piscina-conv-piscina-salida(la salida de la misma como de entrada) ? En ese caso, ¿cómo es la agrupación, depooling supone que para ser administrada ? Debo sólo de la piscina en la última piscina capa antes de la salida ? Y de nuevo - ¿a qué se debe el cambio de tamaño factor de que de la agrupación ? Es la intención de traer a la función de mapas de vuelta a la forma de la entrada ?
Debo ser la introducción de capas de ruido después de cada conv-piscina-depool capa ?
Y luego, cuando sintonía fina - se supone que tengo que quitar sólo el de la agrupación de capas y dejar el resto de la misma. O debo quitar las capas de ruido y de la agrupación de capas
Puede cualquiera me apunte a una url y/o de papel que se ha detallado de la arquitectura de un apilados convolucional auto codificador para hacer pre entrenamiento en las imágenes ?
Muchas gracias