15 votos

El tiempo Pronóstico de Serie con Datos Diarios: ARIMA con regresor

Estoy usando un diario de la serie de tiempo de ventas de datos que contiene alrededor de 2 años de datos diarios de los puntos. Basado en algunos de los en línea-tutoriales / ejemplos traté de identificar la estacionalidad en los datos. Parece que hay una semanal, mensual y, probablemente, de periodicidad anual / estacionalidad.

Por ejemplo, hay días de pago los días, especialmente en el 1er día de pago del mes de efecto que dura unos días durante la semana. También hay algunos específicos de Vacaciones efectos, claramente identificable por toma nota de las observaciones.

Equipado con algunas de estas observaciones, he intentado lo siguiente:

  1. ARIMA (con Arima y auto.arima de R-pronóstico del paquete), el uso de regresor (y de otros valores predeterminados necesarios en la función). El regresor que he creado es básicamente una matriz de 0/1 valores:

    • 11 mes (n-1) variables
    • 12 de vacaciones variables
    • No se pudo averiguar el día de pago de la parte...ya que es poco más complicado efecto de lo que yo pensaba. El día de pago efecto funciona de forma diferente, dependiendo del día de la semana de la 1 de mes.

    He utilizado 7 (es decir, frecuencia semanal) para el modelo de la serie de tiempo. He probado el test - pronóstico de 7 días a la vez. Los resultados son razonables: el promedio de precisión para una previsión de 11 semanas, semanal avg RMSE a 5%.

  2. TBATS modelo (de R-pronóstico del paquete) - uso de varias estacionalidad (7, 30.4375, 365.25) y obviamente no se regresor. La exactitud es sorprendentemente mejor que el modelo ARIMA semanales de avg RMSE 3.5% .

    En este caso, el modelo sin ARMA errores de realizar un poco mejor. Ahora Si puedo aplicar los coeficientes para el Holiday Efectos del modelo ARIMA que se describe en #1, los resultados de la TBATS modelo el semanario avg RMSE mejora a 2.95%

Ahora sin tener mucha experiencia o conocimientos en las teorías de estos modelos, estoy en un dilema si esta TBATS enfoque es aún válido. A pesar de que es la mejora de la RMSE significativamente en las 11 semanas de prueba, me pregunto si se puede mantener la precisión en el futuro. O incluso si la aplicación de las Vacaciones efectos de ARIMA para la TBATS resultado es justificable. Cualquier pensamiento, de cualquier / todos los colaboradores será muy apreciada.

Enlace a los Datos de Prueba

Nota: ¿"Guardar Enlace Como" para descargar el archivo.

9voto

Abs Puntos 145

Usted debe ser la evaluación de modelos y predicciones a partir de diferentes orígenes a través de los diferentes horizontes y no uno de un número con el fin de medir un enfoque.

Supongo que los datos de los estados unidos. Yo prefiero 3+ años de datos diarios, como se puede tener dos fiestas de aterrizaje en un fin de semana y no obtener ningún día de la semana de lectura. Parece que el día de acción de gracias de impacto es un día de descanso en el 2012, o si hubo un error de grabación de algún tipo, y que causó la modelo perderse el día de acción de gracias efecto.

Enero es un mes típicamente bajos en el conjunto de datos si se mira como un % del año. Los fines de semana son de alto. Los dummies reflejar este comportamiento....MONTH_EFF01, FIXED_EFF_N10507,FIXED_EFF_N10607

He encontrado que el uso de un AR componente con datos diarios se supone que las dos últimas semanas del día de la semana es el patrón de cómo el patrón es, en general, lo cual es mucho suponer. Empezamos con 11 mensual de los maniquíes y 6 diario de los maniquíes. Algunos se retiraron de la modelo. B**1 significa que hay un desfase de impacto el día después de las vacaciones. Hubo 6 días especiales del mes (días 2,3,5,21,29,30\begin{align}\begin{vmatrix} 5&-7&2&2\\ 0&3&0&-4\\ -5&-8&0&3\\ 0&5&0&-6\\ \end21 podría ser falsos?) y 3 tendencias en el tiempo, 2 de temporada pulsos (donde un día de la semana, comenzó a desviarse de la típica, un 0 antes de este tipo de datos y 1 de cada 7 días después) y 2 los valores atípicos (nota del día de acción de gracias!) Este tomó poco menos de 7 minutos. Descargar todos los resultados aquí www.autobox.com/se/dd/daily.zip

Incluye un rápido y sucio XLS hoja para comprobar si el modelo tiene sentido. Por supuesto, el XLS % son de hecho lo malas que son de crudo puntos de referencia.

Pruebe la estimación de este modelo:

Y(T) =  .53169E+06                                                                                        
       +[X1(T)][(+  .13482E+06B** 1)]                                       M_HALLOWEEN
       +[X2(T)][(+  .17378E+06B**-3)]                                       M_JULY4TH
       +[X3(T)][(-  .11556E+06)]                                            M_MEMORIALDAY
       +[X4(T)][(-  .16706E+06B**-4+  .13960E+06B**-3-  .15636E+06B**-2                                                 
       -  .19886E+06B**-1)]                                                 M_NEWYEARS
       +[X5(T)][(+  .17023E+06B**-2-  .26854E+06B**-1-  .14257E+06B** 1)]   M_THANKSGIVI
       +[X6(T)][(-  71726.    )]                                            MONTH_EFF01
       +[X7(T)][(+  55617.    )]                                            MONTH_EFF02
       +[X8(T)][(+  27827.    )]                                            MONTH_EFF03
       +[X9(T)][(-  37945.    )]                                            MONTH_EFF09
       +[X10(T)[(-  23652.    )]                                            MONTH_EFF10
       +[X11(T)[(-  33488.    )]                                            MONTH_EFF11
       +[X12(T)[(+  39389.    )]                                            FIXED_EFF_N10107
       +[X13(T)[(+  63399.    )]                                            FIXED_EFF_N10207
       +[X14(T)[(+  .13727E+06)]                                            FIXED_EFF_N10307
       +[X15(T)[(+  .25144E+06)]                                            FIXED_EFF_N10407
       +[X16(T)[(+  .32004E+06)]                                            FIXED_EFF_N10507
       +[X17(T)[(+  .29156E+06)]                                            FIXED_EFF_N10607
       +[X18(T)[(+  74960.    )]                                            FIXED_DAY02
       +[X19(T)[(+  39299.    )]                                            FIXED_DAY03
       +[X20(T)[(+  27660.    )]                                            FIXED_DAY05
       +[X21(T)[(-  33451.    )]                                            FIXED_DAY21
       +[X22(T)[(+  43602.    )]                                            FIXED_DAY29
       +[X23(T)[(+  68016.    )]                                            FIXED_DAY30
       +[X24(T)[(+  226.98    )]                                            :TIME TREND        1                   1/  1   1/ 3/2011   I~T00001__010311stack
       +[X25(T)[(-  133.25    )]                                            :TIME TREND      423                  61/  3   2/29/2012   I~T00423__010311stack
       +[X26(T)[(+  164.56    )]                                            :TIME TREND      631                  91/  1   9/24/2012   I~T00631__010311stack
       +[X27(T)[(-  .42528E+06)]                                            :SEASONAL PULSE  733                 105/  5   1/ 4/2013   I~S00733__010311stack
       +[X28(T)[(-  .33108E+06)]                                            :SEASONAL PULSE  370                  53/  6   1/ 7/2012   I~S00370__010311stack
       +[X29(T)[(-  .82083E+06)]                                            :PULSE           326                  47/  4  11/24/2011   I~P00326__010311stack
       +[X30(T)[(+  .17502E+06)]                                            :PULSE           394                  57/  2   1/31/2012   I~P00394__010311stack
      +                    +   [A(T)]

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X