20 votos

¿Algunos ejemplos de formación es muy pocos cuando se entrena una red neuronal?

Soy un principiante tratando de armar mi primer proyecto. Yo tenía una canción clasificación del proyecto en mente, pero ya me gustaría ser etiquetado manualmente, lo único que podría razonablemente poner juntos alrededor de 1000 canciones, o 60 horas de música.

Yo sería la clasificación con varias clases, por lo que es posible que una clase tenga tan pocos como 50-100 canciones en el conjunto de entrenamiento - esto parece como muy pocos! Hay una regla general para la cantidad de datos que se necesita para entrenar una red neuronal para darle un tiro en el trabajo?

Edit: yo estaba pensando en usar una de vainilla LSTM. La entrada características tendrá la dimensión de 39 años, de salida de dimensión 6, mi primer intento para la capa oculta dimensión sería 100.

22voto

Franck Dernoncourt Puntos 2128

Realmente depende de su conjunto de datos y arquitectura de la red. Una regla de oro que he leído (no recuerdo la fuente pero creo que es una confiable) fue un par de miles de muestras por clase para la red neuronal de empezar a realizar muy bien.

En la práctica, es que la gente quiere ver. No es raro encontrar estudios que muestran buenos resultados con un conjunto de entrenamiento menor que 1000 muestras.


Una buena manera de evaluar en qué medida podría ser beneficioso tener más muestras de formación, es imprimir el rendimiento de la red neuronal basada en contra de la talla del conjunto de entrenamiento, por ejemplo, de (1):

enter image description here


i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X