6 votos

¿Cómo elegir un modelo ARIMA adecuado teniendo en cuenta el ACF y el PACF?

Soy nuevo en los modelos ARIMA, y estoy jugando con R tratando de encontrar uno bueno... Pero hasta ahora mis parcelas han sido ni siquiera cerca de parecerse a ruido blanco...

¿Podría darme algunos consejos sobre estas parcelas ACF y PACF?

ACF de la serie temporal original comparada con la ACF de la primera diferencia de los datos:

ACF of the original time series compared to the ACF of the first difference of the data

PACF de la serie temporal original comparado con el PACF de la primera diferencia de los datos:

PACF of the original time series compared to the PACF of the first difference of the data

7voto

Owen Fraser-Green Puntos 642

Las imágenes sugieren que sus datos son probablemente datos horarios, lo que significa que puede haber efectos diarios dependiendo del tipo de datos que sean. Los efectos diarios suelen incluir efectos del día de la semana, efectos semanales, efectos de las vacaciones, etc. y, por supuesto, posibles valores atípicos, cambios de nivel y tendencias temporales. Por qué no publica sus datos y su tipo y quizás pueda ayudarle más. Observar los gráficos acf (síntomas) para deducir las "causas" puede ser útil, pero muchas veces es insuficiente para identificar un modelo útil. Apoyarse en estadísticas simples como BIC y AIC puede ser confuso (¡casi siempre!) cuando los datos tienen una estructura inherente que no sea ARIMA muy simple. Los datos muy simples suelen aparecer en los libros de texto que se empeñan en proponer herramientas sencillas de identificación de modelos, pero casi nunca en el mundo real.

EDITADO DESPUÉS DE LA SOLICITUD DE ALTERNATIVAS VIABLES A LA BIC Y A LA TOMA DE DECISIONES de Math's Fun:

Además de AUTOBOX ( basado en el tema de mi disertación ) que utiliza una heurística incorporada que muestra el proceso paso a paso, puedo proporcionar aquí una guía de alto nivel. Hay una versión gratuita (incluyendo una versión en R) que permite utilizar cientos de conjuntos de datos de libros de texto sin ningún compromiso. Esta función gratuita puede ser muy educativa e instrumental para ampliar la conciencia de uno en cuanto a posibles trampas y enfoques para la identificación de modelos.

En resumen, la identificación de ARIMA (¡cualquier modelo!) es un proceso iterativo y no un proceso único. El punto de vista anacrónico de que se puede suponer que no hay valores atípicos y formar un modelo que detecte posteriormente los valores atípicos sugiere una posible (probable) suboptimización porque se ha demostrado que la primera suposición es errónea. El enfoque moderno requiere un enfoque exhaustivo/simultáneo/global que produce un modelo holístico que combina tanto la memoria (ARIMA) como las variables ficticias necesarias. Por poner un ejemplo. En primer lugar, identifique los posibles impulsos/desplazamientos de nivel/tendencias temporales locales/impulsos estacionales y, a continuación, tome los residuos de este modelo tentativo e identifique ARIMA . Ahora forme un modelo compuesto/híbrido y valide/pruebe la estructura restante en los errores, que puede incluir modificaciones ARIMA y variables ficticias adicionales y un posible tratamiento de los parámetros que varían en el tiempo y/o la varianza de error que varía en el tiempo. En segundo lugar, se podría utilizar el procedimiento de autocorrelación inversa http://www.eco.uc3m.es/~jgonzalo/enseñanza/serie de tiempoMA/IdentificaciónWei.pdf para proporcionar un modelo ARIMA inicial razonable y proceder a partir de ahí para aumentar según sea necesario. Otro enfoque muy útil es el EACF o ACF ampliado Con respecto a las series temporales ARMA, ¿qué es exactamente la eacf (función de autocorrelación ampliada)? . El mencionado AUTOBOX utiliza un híbrido de estos dos para identificar inicialmente un modelo antes de iterar hacia una solución estadísticamente significativa y parsimoniosa.

Por lo tanto, la identificación del modelo es un proceso iterativo y de autocomprobación.

0 votos

Muy interesante la idea :-). Sin embargo, estaba pensando en qué se puede hacer en la práctica si dejamos de lado la selección de modelos de tipo BIC. ¿Podría aconsejarme, por favor? Muchas gracias.

1voto

Hardwareguy Puntos 1753

Dado que la ACF de la serie se acerca a cero con el aumento de los rezagos, el orden de integración debe ser 0, es decir, se tiene ARIMA(p,0,q). (aquí podría ser un poco cauteloso ya que podrías tener el orden de intergarción, $d$ , de tal manera que $-\frac12<d<0$ en caso de que le interesen los filtros de dependencia de largo alcance).

Por otro lado, como la ACF tiene oscilaciones por debajo y por encima de cero, tienes algo de antiperturbación en tus datos. El PACF se acerca a cero después de casi 30 rezagos, de ahí que q esté posiblemente por debajo de 30. Sin embargo, no es tan fácil decir algo sobre p. ¿Intentó utilizar un criterio de información como el BIC?

¿Podría compartir la fuente de sus datos o decir un poco lo que representan?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X