Soy un principiante tratando de armar mi primer proyecto. Yo tenía una canción clasificación del proyecto en mente, pero ya me gustaría ser etiquetado manualmente, lo único que podría razonablemente poner juntos alrededor de 1000 canciones, o 60 horas de música.
Yo sería la clasificación con varias clases, por lo que es posible que una clase tenga tan pocos como 50-100 canciones en el conjunto de entrenamiento - esto parece como muy pocos! Hay una regla general para la cantidad de datos que se necesita para entrenar una red neuronal para darle un tiro en el trabajo?
Edit: yo estaba pensando en usar una de vainilla LSTM. La entrada características tendrá la dimensión de 39 años, de salida de dimensión 6, mi primer intento para la capa oculta dimensión sería 100.