Problema: Estoy construyendo un modelo de previsión de series temporales para datos diarios en el que, el objetivo es prever para la próxima semana. Para validar el modelo, utilizo una validación basada en una ventana móvil en la que tomo 8 semanas (56 días) de datos y hago una previsión para la siguiente semana (7 días) y luego muevo la ventana 7 días hasta el final de la serie. Con los valores reales y los pronosticados, puedo medir la precisión del pronóstico.
Pregunte: Ahora quiero realizar un benchmarking del modelo con algo muy simple como la media móvil sobre múltiples ventanas (30, 45, 60) de días. ¿Es este tipo de evaluación comparativa estadísticamente correcta? ¿Cuál es la forma correcta de evaluar un modelo de previsión de series temporales con algo tan simple como una media móvil?