6 votos

¿Qué hacer si el ACF o el PACF muestran rezagos significativos más altos?

Tengo datos climáticos mensuales de 90 años. Armé el mejor modelo que pude (agregué parámetros sensibles para minimizar el AIC), y luego probé varias estructuras de correlación ARMA (usando gls en el paquete lmne en R) para reducir los rezagos pequeños (<30) significativos. A continuación, seleccioné el modelo ARMA con el AIC más bajo como mejor modelo.

Sin embargo, según los gráficos ACF y PACF, sigue habiendo rezagos significativos de intervalos mayores (>30).

ACF_PACF_GDD_NC graphs

Mis preguntas son:

  1. ¿Cómo debo reaccionar ante eso? ¿Las considero importantes o espurias?

    • Inicialmente supuse que si el lag 60 (asociado a 5 años) era significativo, entonces esto indicaría que hay una tendencia de 5 años en mis datos. Sin embargo, me pareció escuchar antes que ACF/PACF no es una buena manera de abordar los rezagos a largo plazo.
  2. ¿Qué hago con esto? ¿Cómo puedo reducir los retrasos más grandes?

    • Por ejemplo, ¿existe una combinación específica de ARMA p/q que reduzca "mejor" los rezagos más grandes? ¿O debería intentar añadir variables sin/cos en mi modelo? ¿O algún otro enfoque?

    • De nuevo, si el ACF/PACF no es bueno para identificar los grandes rezagos, ¿cómo podría determinar los patrones cíclicos "reales" a largo plazo para tener en cuenta?

1 votos

No me preocupan estos desfases, son correlaciones benignas.

3 votos

Estoy de acuerdo con @Aksakal, además, fíjate que 6 de los 120 PACs están más allá de los límites del 95%, que es exactamente lo que se esperaría de los "valores verdaderos" de 0 con error de muestreo. Un poco más difícil de decir con el ACF, pero parece que tal vez 5-8 están más allá de los límites del 95%, que es también más o menos lo que cabría esperar de "valores verdaderos" de 0.

4voto

AdamSane Puntos 1825

[Creo que esto es un duplicado - y aunque puedo encontrar preguntas con este problema explicado en los comentarios, el par que lo explican correctamente y completamente en las respuestas no están realmente respondiendo a la misma pregunta. Probablemente hay un buen duplicado en algún lugar, pero como no pude localizar uno - esto servirá como una respuesta en el ínterin].

Si elige como límite de significación para cada retardo un intervalo del 95% (de modo que concluye que el ACF o PACF en el retardo de lixiviación era distinto de cero si su magnitud era mayor que el límite del intervalo del 95%), entonces cuando no hubiera valores ACF o PACF poblacionales distintos de cero, esperaría ver el 5% de sus valores de muestra fuera de los límites. (Si los valores ACF o PACF de su muestra para cada retardo fueran independientes entre sí, el número fuera sería binomial( $l,0.05$ ), donde $l$ es el número de rezagos diferentes considerados).

Así que, aunque no pasara nada, debería ver un 5% de los valores algo fuera de los límites. Por ejemplo, con 120 rezagos se espera que 6 estén fuera de los límites sin que las autocorrelaciones de la población sean distintas de cero, pero, por supuesto, la variación aleatoria significa que puede ver un poco más de 6 o menos de 6.

De hecho, no obtener ninguno de los valores fuera de esas líneas del 95% sería sospechoso - usted no debería ¡Vean eso!

Así que no hay ninguna razón sobre la base de lo que vemos en esos diplays para pensar que hay algo que está pasando - las pantallas son bastante consistentes con la independencia en la serie que calculó el ACF de.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X