Me gustaría utilizar la optimización bayesiana para afinar los hiperparámetros de una red neuronal feed-forward.
Entre estos hiperparámetros, se encuentra el número de capas ocultas de la red, así como el número de nodos de cada capa. La cuestión es que el número de hiperparámetros depende del valor elegido para el número de capas. Por ejemplo, con una sola capa oculta, sólo hay un parámetro para el número de nodos. Con cinco capas ocultas, hay que elegir cinco números de nodos.
¿Hay alguna manera inteligente de manejar esto? ¿O tengo que elegir entre optimizar el número de capas con un tamaño de capa fijo y optimizar el número de nodos en cada capa con un número de capas fijo?