Estoy usando un diario de la serie de tiempo de ventas de datos que contiene alrededor de 2 años de datos diarios de los puntos. Basado en algunos de los en línea-tutoriales / ejemplos traté de identificar la estacionalidad en los datos. Parece que hay una semanal, mensual y, probablemente, de periodicidad anual / estacionalidad.
Por ejemplo, hay días de pago los días, especialmente en el 1er día de pago del mes de efecto que dura unos días durante la semana. También hay algunos específicos de Vacaciones efectos, claramente identificable por toma nota de las observaciones.
Equipado con algunas de estas observaciones, he intentado lo siguiente:
-
ARIMA (con
Arima
yauto.arima
de R-pronóstico del paquete), el uso de regresor (y de otros valores predeterminados necesarios en la función). El regresor que he creado es básicamente una matriz de 0/1 valores:- 11 mes (n-1) variables
- 12 de vacaciones variables
- No se pudo averiguar el día de pago de la parte...ya que es poco más complicado efecto de lo que yo pensaba. El día de pago efecto funciona de forma diferente, dependiendo del día de la semana de la 1 de mes.
He utilizado 7 (es decir, frecuencia semanal) para el modelo de la serie de tiempo. He probado el test - pronóstico de 7 días a la vez. Los resultados son razonables: el promedio de precisión para una previsión de 11 semanas, semanal avg RMSE a 5%.
-
TBATS modelo (de R-pronóstico del paquete) - uso de varias estacionalidad (7, 30.4375, 365.25) y obviamente no se regresor. La exactitud es sorprendentemente mejor que el modelo ARIMA semanales de avg RMSE 3.5% .
En este caso, el modelo sin ARMA errores de realizar un poco mejor. Ahora Si puedo aplicar los coeficientes para el Holiday Efectos del modelo ARIMA que se describe en #1, los resultados de la TBATS modelo el semanario avg RMSE mejora a 2.95%
Ahora sin tener mucha experiencia o conocimientos en las teorías de estos modelos, estoy en un dilema si esta TBATS enfoque es aún válido. A pesar de que es la mejora de la RMSE significativamente en las 11 semanas de prueba, me pregunto si se puede mantener la precisión en el futuro. O incluso si la aplicación de las Vacaciones efectos de ARIMA para la TBATS resultado es justificable. Cualquier pensamiento, de cualquier / todos los colaboradores será muy apreciada.
Nota: ¿"Guardar Enlace Como" para descargar el archivo.