2 votos

¿Utilizar modelos entrenados con validación cruzada para la predicción fuera de la muestra o entrenar un nuevo modelo utilizando los datos completos?

Estoy usando support vector regression(SVR) y validación cruzada de 5 veces para la predicción de precios. ¿cuál es más apropiado después de entrenar los modelos para la predicción fuera de muestra (precio desconocido mañana)?

  • ¿Utilizando 5 modelos entrenados y la media entre los resultados de los modelos para predecir el precio del día siguiente?

  • ¿Entrenar un nuevo modelo SVR con todos los datos utilizando los parámetros seleccionados (estoy utilizando la búsqueda codiciosa en este procedimiento y en el anterior) y predecir el precio del día siguiente utilizando este nuevo modelo entrenado?

1voto

cprcrack Puntos 111

La validación cruzada se utiliza para la selección de modelos, es decir, para comparar los modelos candidatos y determinar sus parámetros. Una vez elegido el modelo o el parámetro que minimice el error de la prueba, deberá utilizar el conjunto de datos completo para entrenar un nuevo modelo para las predicciones reales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X