Estoy jugando con abandono ya que todos los resultados punteros en aprendizaje automático parecen utilizarlo (por ejemplo, véase aquí ). Conozco todas las directrices (entrenar durante más tiempo, aumentar la capacidad del modelo, utilizar tasas de aprendizaje más altas), pero sigo sin ver que funcione. He probado varios ejemplos diferentes: CNN para IMDB , CNN para MNIST MLP para MNIST, MLP para IRIS y la desactivación del dropout mejora todos mis resultados, a pesar de que las configuraciones por defecto tienen dropout (tomado de la página Ejemplos de Keras ). Por ejemplo, adjunto mis resultados para uno de los modelos entrenados en el conjunto de datos IRIS. La configuración sin dropout tiene claramente el mejor rendimiento.
¿Qué me estoy perdiendo?
El código del ejemplo IRIS es aquí .