4 votos

Modelando una serie de tiempo con estacionalidad decreciente

Tengo un time series datos con su ACF se muestra a continuación. La unidad de tiempo es el día(s). enter image description here

Lo que parece intrigante para mí es que no parece ser una de picos en cada una de las 7 o 8 de los gal, y parece que hay una tendencia estacional, pero la tendencia disminuye a medida que los gal aumento. Yo uso auto.arima() a seleccionar el mejor ajuste de la ARIMA proceso de acuerdo a los criterios de información, y a continuación es una de las ACF de los residuos de un modelo con ARIMA(2,0,1) with non-zero mean:

enter image description here

Mientras que el patrón es más débil después de ARIMA(2,0,1), todavía es apreciable y me pregunto cuál sería la mejor manera de modelo de esta tendencia. He tratado de usar maniquíes a la dirección de la estacionalidad, tales como:

Los días de la semana

data$wday <- wday(dataset$time)
season <- lm(data$variable ~ factor(data$wday))
pacf(season$residuals)

Mes

data$month <- month(data$time)
season <- lm(data$variable ~ factor(data$month))
pacf(season$residuals)

Cuartos

data$quarter <- quarter(data$time)
season <- lm(data$variable ~ factor(data$quarter))
pacf(season$residuals)

Pero el modelo es todavía bastante perceptibles en todos los casos.

Para la serie de tiempo de los profesionales en el foro, hay otras maneras en que usted podría utilizar para este modelo de datos? El ARIMA(2,0,1) pasa el Box.test. Pero estoy simplemente no se siente satisfecho como se ve como algo asociado con el tiempo lo es todavía en el residual de la ACF.

Archivo adjunto: aquí hay un enlace a un archivo csv de ejemplo.

2voto

Owen Fraser-Green Puntos 642

Cuando se utiliza un fármaco (o una pieza de software como auto.arima usted debe leer las advertencias en la etiqueta ... por ejemplo auto.arima basado en mi experiencia es muy sospechoso cuando se trata con datos del mundo real que tiene valores atípicos/o anomalías a nivel de turnos o determinista de las tendencias en el tiempo. Aquí es un gráfico de los datos enter image description here . Un adicional de advertencia no utilice si usted tiene un montón y un montón de ceros enter image description here . Una advertencia adicional es que se supone que no hay efectos fijos como los días de la semana , las semanas del mes o mensual de los efectos o de Vacaciones Efectos . Sus datos no parece tener tanto mensual de efectos y Vacaciones Efectos y posiblemente el espurio un-día-de-la-mes efecto .enter image description here

Nueva sin experiencia de series de tiempo de los analistas a menudo con un econométricos formación general no sabe nada o muy poco de estas cosas (hipótesis). Sin darse cuenta están usando mal la analítica (aunque libre) de software en mi opinión. Aquí está el resumen del modelo teniendo en cuenta la memoria (que no existe) , mensuales efectos , vacaciones efectos , un determinado día del mes) y anomalías está aquí .

En el cierre de uno podría mirar con cuidado en https://www.quora.com/What-are-some-skills-nuances-that-software-engineer-turned-data-scientists-lack-that-statisticians-ML-PHDs-possess/answer/Daniel-Tunkelang?ref=fb_page .

La idea es educar a los nuevos y viejos usuarios sobre las complejidades del mundo real, análisis de series de tiempo y para arrojar luz sobre las soluciones que pueden no ser lo suficientemente general para ser usado de manera rutinaria. Mi experiencia me dice (withou ver sus coeficientes) que su (3,0,3) o (2,0,1) son sólo artefactos de ajuste frente a la modelización y la mayoría probablemente ha auto-cancelación de la estructura es decir redundante ARMA estructura .

En respuesta a @Whuber excelente pregunta , preguntando por los detalles (siempre una buena idea !):

@whuber Identificación de los diarios de la estacionalidad se logra de dos maneras 1) mediante el examen de la ACF /FAP significativos de la estructura (ARIMA estacionalidad) en gal 7.14 etc. o 2) por intentar incorporar el 6 de temporada o fijos dummies que representan los días de la semana . Tampoco se ha encontrado para ser útil o significativo, en este caso. En términos de estacionalidad Mensual esto fue detectado por el simple ensayo y error, es decir, la configuración de los 11 indicadores mensuales y haciendo un paso hacia abajo. La Fiesta de los factores estacionales (plomo, contemporáneas y lag) también fueron encontrados a través de una heurística basada en datos del proceso de búsqueda de ceder dos de vacaciones de temporada de las variables de la Navidad y el Mardi Gras) . El día 14 de efecto también fue encontrado por una búsqueda/método de prueba y error. Por lo tanto CUATRO claramente diferentes "factores estacionales" fueron evaluados con ARIMA estacionalidad totalmente rechazado. auto.arima, en mi experiencia, sólo intenta encontrar ARIMA estacionalidad de una lista basada en ensayo y error en lugar de una basada en datos de prueba y error.

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X