1 votos

Modelización de los efectos de las vacaciones móviles en las previsiones

He investigado múltiples cuestiones relacionadas( aquí , aquí ), pero carece de contexto y soluciones detalladas.

Mi objetivo es mejorar la precisión de mis previsiones de ventas diarias tras haber incorporado un simple maniquí de vacaciones para el año nuevo lunar.

y <- msts(train$Sales, seasonal.periods=c(7,365.25))
# precomputed optimal fourier terms
bestfit$i <- 3
bestfit$j <- 20
z <- fourier(y, K=c(bestfit$i, bestfit$j))
fit <- auto.arima(y, xreg=cbind(z,train_df$cny), seasonal=FALSE)
# forecasting
horizon <- length(test_ts)
zf <- fourier(y, K=c(bestfit$i, bestfit$j), h=horizon)
fc <- forecast(bestfit, xreg=cbind(zf,test_df$cny), h=horizon)
plot(fc, include=365, type="l", xlab="Days", ylab="Sales", main="Comparing arimax forecast and actuals")
lines(test_ts, col='green')

ARIMAX forecast

Sin embargo, esto no refleja el efecto retardado de las vacaciones.

Impact on sales around lunar new year

Una aproximación será modelizar los efectos con una variable continua (ajustada a la curva de efectos anterior), pero me gustaría escuchar otras sugerencias.

0voto

Owen Fraser-Green Puntos 642

Algunos puntos que pueden ayudarte. 1) Los enfoques de Fourier inyectan estructura en las previsiones que podría no estar presente en los datos, pero inducida por la ecuación. Deberías examinar los residuos del modelo con detenimiento. 2) Es necesario detectar el adelanto y el retraso óptimos en torno a cada posible fiesta o acontecimiento y desarrollar un modelo que incluya estos efectos. Como es habitual, también puede haber efectos mensuales/efectos de cambio de nivel/tendencias múltiples, así como observaciones anómalas. Además, algunos días del mes pueden ser especiales e incluso la semana del mes puede influir. He implementado muchas de estas pruebas previas en un paquete comercial llamado AUTOBOX que fue citado por @forecaster en una de sus citaciones.

0voto

Richard Hardy Puntos 6099

Podrías

  1. incluir una serie de variables ficticias para las fechas en torno al año nuevo lunar; o bien
  2. hacer lo que has dicho (ajustar una curva).

La primera opción permite mucha flexibilidad, pero podría llevar a un ajuste excesivo. Si el número de años de la muestra es bajo, 1. probablemente introduciría bastante ruido adicional para reflejar cualquier señal. Estaría bien aplicar algún tipo de regularización (contracción) para evitar el sobreajuste, pero sería un reto técnico.

La segunda opción es menos flexible y hay que decidir la forma funcional, pero es menos propensa al sobreajuste.

La modelización de la función de transferencia podría ser probablemente una buena idea, pero no puedo decir mucho al respecto por experiencia propia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X