He leído muchas veces que una buena depuración de paso, mientras que la construcción de una máquina modelo de aprendizaje es tratar de overfit su modelo para un subconjunto muy pequeño de sus datos. [Aquí es un ejemplo][1].
Siempre que su código es libre de errores, siempre es posible conseguir una perfecta o casi perfecta de rendimiento en el conjunto de entrenamiento cuando usted hace esto? Podría hacerlo incluso en un pequeño conjunto de datos de números aleatorios?
Tengo un modelo que está logrando significativamente mayor precisión en mis datos reales que si me alimento de ti números aleatorios, pero su lejos de ser perfecto, y parece que no importa cuán pequeño me hacen el conjunto de datos, el número de capas que yo uso, o cómo de grande puedo hacer las capas, la precisión de las estancias de la misma. Lo que podría causar esto?
ACTUALIZACIÓN: Gracias a las personas que respondieron, entiendo que debe ser siempre posible para adaptarse a un pequeño subconjunto de los datos, así que eché otro vistazo a mi aplicación.
Resultó que había varios pequeños problemas. Conmutación aleatoria uniforme el peso de inicialización a xavier de inicialización proporcionado un importante bache en mis resultados (supuse que esto sería sólo mejorar la velocidad a la que la formación convergen a la misma mierda de resultado, pero en realidad mejora la exactitud en general). Yo también no tienen totalmente normalizado de datos. Todo estaba en un rango de 0 a ~10, que inicialmente se pensó que debería ser lo suficientemente bueno, pero tengo otro gran golpe en el rendimiento cuando me normalizado a -1 a 1. Un tercer problema que tuve fue con mi conjunto de validación. Mis datos están en varios conjuntos diferentes de diferentes fuentes, y resultó que eran distintos "estilos" o tendencias para cada conjunto. Estaba entrenando en la mayoría de los conjuntos de datos, y la evaluación en un determinado conjunto. Cuando me barajan todos los ejemplos individuales en conjunto de todos los conjuntos, y luego sacó de mi conjunto de validación al azar de la baraja establecer, empecé a ver las precisiones en el medio y superior de los 90!