4 votos

¿Por qué auto.arima no captura la obvia estacionalidad?

Tengo de las ventas de un conjunto de datos, cuyo comportamiento (básica de la dispersión y de la serie de tiempo de las parcelas), es la siguiente:

plot(myData[,'sales'])

enter image description here

plot.ts(myData[,'sales'])

enter image description here

Claramente tiene una estacionalidad. Ahora el ARIMA(p,d,q) que me quepa en esta serie debe tener un d > 0, debido a que d es el grado de diferenciación, por ARIMA documentación. Pero cuando yo entraba en mi ARIMA usando auto.arima (que se supone es el ajuste más adecuado ARIMA de especificación), me da un simple ARIMA(1,0,2), es decir, sólo AR y MA coeficientes resultan ser positivos (significativo).

> fit <- auto.arima(myData[,'sales'])
> fit
Series: myData[, "sales"] 
ARIMA(1,0,2) with non-zero mean 

Coefficients:
          ar1     ma1     ma2        mean
      -0.7374  1.1341  0.4917  21585195.8
s.e.   0.1013  0.1087  0.0883    297309.5

sigma^2 estimated as 5.487e+12:  log likelihood=-2201.96
AIC=4413.92   AICc=4414.38   BIC=4428.52
> coeftest(fit)

z test of coefficients:

             Estimate  Std. Error z value  Pr(>|z|)    
ar1       -7.3740e-01  1.0131e-01 -7.2790 3.364e-13 ***
ma1        1.1341e+00  1.0866e-01 10.4370 < 2.2e-16 ***
ma2        4.9172e-01  8.8272e-02  5.5705 2.541e-08 ***
intercept  2.1585e+07  2.9731e+05 72.6018 < 2.2e-16 ***

¿Por qué es el auto.arima no devolver un ARIMA positivo differencing plazo, a pesar de la clara estacionalidad? Estoy desconcertado, me estoy perdiendo algo? Gracias de antemano!

Edit: Por @IrishStat de la solicitud, las características de los datos es:

Time Series:
Start = c(1, 1) 
End = c(3, 33) 
Frequency = 52

Y estos son los datos en sí (pegado con comas):

paste(myData[,"sales"], collapse=",")
[1] "23444736.14,22273846.64,22474784.83,20234521.78,21568615.3,21271741.54,20726570.6,20130605.86,23411624.39,21774496.54,20801375.54,20543443.09,20112594.01,22451986.27,20839531.78,20656799.62,21670794.45,23128781.3,21887438.65,21773694.7,21350360.65,22481049.57,21972796.92,21081896.35,20417343.63,20229950.07,21864508.8,21207335.75,21455475.55,20786594.16,21690685.75,20901793.4,19698199.59,18850409.98,19352642.09,20697939.05,19834676.12,19566690.5,20024133.4,21204002.72,21305121.47,20913385.61,29803713.96,22834981.56,25745584.84,28345643.67,37364375.44,18448906.66,19334478.31,18721333.39,18127802.7,21483605.53,21867483.44,20257402.22,21746739.76,20608246.83,20676473.11,19497001.47,19911182.96,21054727.11,20696063.24,22606935.38,19966615.38,21545415.91,20876158.72,20098920.37,20614878.59,22313792.41,21845943.75,21793994.73,20932470.22,21834770.68,22198523.59,20845592.48,20660356.36,19924813.45,22101584.53,21100080,21466551.62,21529024.24,20837769.44,21520994.15,20028227.43,19591447.27,19341245.63,21788431.82,20431596.94,20984002.2,20911214.76,22412061.55,22247144.11,21456827.1,29962015.07,22280971.98,25526650.5,27420528.38,35409546.41,20905503.86,20236766.68,19138569.2,23044047.57,20895930.98,21257464.37,21805649.05,21558396.06,20381410.01,20494442.17,24630420.1,21317910.43,20291895.8,19815815.25,21553715.71,21415932.86,21382819.11,21650703.54,21986862.6,22571940.1,21954094.84,21386738.18,20948276.35,23446210.65,20699070.67,20643123.29,19663473.25,21381360,21380832.53,21341274.6,21080007.24,21132219.71,21857036.27,19840075.49,20057651.36,19533145.22,21570686.07,20819272.94,20140501.21,20493826.87"

2voto

Owen Fraser-Green Puntos 642

Como supuse de la trama de los datos de un modelo de utilidad es un híbrido de 6 de efectos estacionales ( 5 positivo, 1 negativo ) y un ar(2) con 2 puntos anómalos (99 y 93). Tomé su 136 valores enter image description here y los introdujo AUTOBOX una pieza de software que se integra a la perfección tanto de auto-regresivo de la estructura y determinista de la estructura.

Esta es la real y la previsión de la parcela enter image description here y una más ocupado de lo real/ajuste/pronóstico de la parcela con la previsión de los intervalos de confianza enter image description here . Los pronósticos están aquí enter image description here

La ecuación tiene 6 determinista efectos estacionales (semanas 43-48) lo que refleja los importantes y repetitivos de la pre-navidad de actividad y dos impulsos y un ar(2) componente enter image description here y aquí enter image description here con el modelo de resumen aquí enter image description here

El real/limpiado de la trama pone de relieve los dos valores excepcionales que refleja un efecto no especificado enter image description here

La trama de los residuos (siempre una buena idea ! ) sugiere suficiencia enter image description here . La trama de la acf de los residuos sugiere un indicio de un omitido (no significativo) ar(52) efecto . enter image description here

La respuesta a su pregunta de por qué no fueron capaces de desarrollar un modelo de utilidad tiene que ver con el alcance y el rigor de software alternativo al tratar con los no-ejemplos triviales. Métodos sencillos de trabajar bien con los problemas simples de lo contrario, no tanto. Simplemente estaban pidiendo demasiado de su herramienta de elección. Utiliza un martillo cuando usted necesita el uso de un láser para extraer información de un difícil pero no es inusual conjunto de datos. Los datos requeridos de las herramientas de exploración de datos (iterativo/auto-procedimientos de comprobación) como se sugiere/abrazado por Box Y Jenkins para las series de tiempo/datos cronológicos y J. de Tukey para datos de corte transversal.

Lo que debía hacer era identificar al mismo tiempo ARIMA estructura y cualquier de los efectos deterministas, tales como las legumbres ,el nivel cambia, la hora local de las tendencias, los cambios en los parámetros a través del tiempo y los cambios en la varianza de error a lo largo del tiempo. Ver la desviación de la tendencia en la temporada de datos para un debate y también ver Cómo determinar el orden de sarima? para comentarios adicionales.

Gracias por los datos y el momento de enseñanza oportunidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X