4 votos

Cómo elegir entre el modelo ARIMA y el modelo ARMA

Estoy realizando un análisis de series de tiempo en Python para el conjunto de datos dado a continuación-

Aquí está el enlace

El gráfico de la serie temporal anterior parece no estacionario para mí porque al observarlo parece que consiste en alguna tendencia. El gráfico de la serie temporal anterior es el siguiente- Introduzca la descripción de la imagen aquí

El gráfico anterior se convierte en una serie de tiempo estacionaria tomando el logaritmo y luego la diferencia entre los valores anteriores y sucesivos. He trazado los gráficos ACF y PACF correspondientes para esa serie de tiempo no estacionaria que se muestra a continuación- Introduzca la descripción de la imagen aquí

Por el ACF anterior, está claro para mí que la curva se corta después del retraso 1, y también en el gráfico PACF, el número de marcas fuera del corte es 1. Pero a partir de estos dos gráficos, ¿cómo debo elegir el tipo de modelo (ARMA o ARIMA)? Si es un modelo ARMA, ¿cuál es (p, q) y por qué? O si es un modelo ARIMA, ¿cuál es (p, d, q) y por qué?

0 votos

Usted dice "parece estar compuesto por alguna tendencia". Yo digo "parece tener un cambio de nivel.step que indica un cambio en la intercepción"

6voto

icelava Puntos 548

Existen diferentes métodos para decidir sobre el orden de integración para un modelo AR(I)MA no estacional. Hyndman & Khandakar (2008, sección 3.1) dan indicaciones sobre los más comúnmente encontrados. El tipo más común serían pruebas de raíz unitaria, especialmente la prueba de Dickey-Fuller, la cual Hyndman & Khandakar desaconsejan, ya que tiende a favorecer más diferencias en lugar de menos. En cambio, ellos utilizan una prueba KPSS (Kwiatkowski et al., 1992): se prueba para una raíz unitaria; si la prueba es significativa, se diferencian los datos y se vuelve a probar, hasta que la prueba ya no sea significativa.

Sí, estos no son los papers más recientes, pero auto.arima() en el paquete forecast para R todavía utiliza este enfoque, y eso es prácticamente lo más cercano al estándar en análisis de series temporales que puedes conseguir.

Después de haber decidido sobre el orden de integración, necesitas decidir sobre los órdenes de AR y MA. Analizar gráficos de ACF/PACF de residuos sucesivos es el enfoque más antiguo de Box-Jenkins; la forma más moderna sería minimizar un criterio de información como el AICc. Ver la descripción completa de cómo auto.arima() decide sobre un orden de modelo y estima.

En el caso presente, auto.arima() iría por un modelo ARIMA(1,1,1):

births

births <- read.table("daily-total-female-births-CA.csv",header=TRUE,sep=",",colClasses=c("Date","numeric"))
births_ts <- ts(births$births,frequency=365,start=births$date[1])

library(forecast)
plot(forecast(auto.arima(births_ts,stepwise=FALSE,approximation=FALSE),h=30))

Dado que trabajas en Python, puede que te interese pmdarima y en este hilo de SO: equivalente de auto.arima() para python.

0 votos

De tu respuesta entiendo cómo tomar el valor de esos parámetros (p, d, q) para el modelo ARIMA. Pero mi primer problema es cómo decidir si esa serie estacionaria se ajusta al modelo ARMA o ARIMA. ¿Hay algún parámetro para decidir entre los dos modelos anteriores?

0 votos

Sí, esa es la pregunta de integración, con la que comienzo mi respuesta. Si su primer prueba de KPSS es insignificante, no realiza diferenciación, sino que ajusta un modelo ARMA.

0 votos

Esto significa que para el modelo ARMA I=0 y para el modelo ARIMA I>0. Pero, ¿hay alguna manera fácil de decidir ese orden de integración utilizando solo el trazado ACF y PACF? O simplemente observando cómo reducimos la serie a estacionaria.

1voto

Owen Fraser-Green Puntos 642

Su conjunto de datos no solo necesita diferenciarse y transformarse logarítmicamente, SINO que también necesita incorporar un cambio de nivel marginalmente significativo detectable en el período 1974/1, periodo 181. La construcción e identificación del modelo ARIMA debe realizarse junto con la identificación empírica de pulsos, cambios de nivel, pulsos estacionales y tendencias temporales locales, como inteligentemente señaló @AdamO, no simplemente asumiendo que no hay estructura determinista latente Análisis de Series Temporales Interrumpidas - ARIMAX para Datos Biológicos de Alta Frecuencia? ..... "Los correlogramas (acf/pacf) deben calcularse a partir de residuos utilizando un modelo que controle la administración de la intervención, de lo contrario, los efectos de la intervención se consideran ruido gaussiano, subestimando el efecto autorregresivo real."

ingrese la descripción de la imagen aquí

Un modelo útil se encuentra aquí ingrese la descripción de la imagen aquí y aquí ingrese la descripción de la imagen aquí con el acf residual aquí ingrese la descripción de la imagen aquí

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X