31 votos

¿Qué impacto tiene el aumento de los datos de entrenamiento en la precisión general del sistema?

¿Puede alguien resumirme con posibles ejemplos, en qué situaciones aumentar los datos de entrenamiento mejora el sistema en general? ¿Cuándo detectamos que agregar más datos de entrenamiento podría sobreajustar los datos y no dar buenas precisiones en los datos de prueba?

Esta es una pregunta muy poco específica, pero si desea responderla específicamente para una situación particular, hágalo.

2voto

mat_geek Puntos 1367

Aumentar los datos de entrenamiento siempre agrega información y debería mejorar el ajuste. La dificultad surge si luego evalúa el rendimiento del clasificador solo en los datos de entrenamiento que se usaron para el ajuste. Esto produce evaluaciones optimistamente sesgadas y es la razón por la que se utilizan en su lugar la validación cruzada o el bootstrap.

-1voto

NOPE Puntos 1

El análisis de espectro ayudará en el análisis de la diversidad de la muestra, de hecho, la información falsa se aprenderá en el modelado si no se agregan "muestras reales", lo que generalmente se denomina sobreajuste. Por lo general, si la información proporcionada por muestra es menor, se recomienda proporcionar la muestra más real para garantizar que la información útil se pueda utilizar en las pruebas. ¡Buena suerte!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X