8 votos

Revisión de la metodología Box-Jenkins

Acabo de terminar de desarrollar un modelo ARMAX con python (principalmente statsmodels) con el fin de pronosticar algunos datos. Mi siguiente paso es probar los datos (24 series temporales) con el modelo ARMAX dado. Como necesito escribir una documentación académica adecuada sobre todas las pruebas que utilizo y la forma en que pruebo mis datos, necesito tener un diseño de pruebas adecuado.

He encontrado algunos buenos diseños aquí: http://www.autobox.com/cms/index.php/blog/entry/build-or-make-your-own-arima-forecasting-model

Sin embargo, mi modelo y el diseño de las pruebas se parecen a esto:

  1. Preparación de los datos (identificación y diferencia de datos para obtener series estacionarias)
    • Estadísticas descriptivas para cada hora (recuento, media, asimetría, etc.)
    • Prueba de Dickey Fuller aumentada para detectar la estacionariedad de una serie temporal dada

--> documentación de excel: ¡La estacionariedad de las series temporales existe!

  1. Selección del modelo (examinar los datos, ACF, PACF para identificar el potencial (elegir p y q tentativos)
    • Trazar y analizar ACF y PACF
    • Selección automática del criterio de información más bajo (AIC, BIC, HQIC)

--> documentación de excel: Gráfico/imagen de ACF y PACF, interpretación del gráfico, criterio de información más bajo (AIC, BIC, HQIC)

  1. Estimación (estimación de parámetros en el modelo potencial y pruebas. Seleccionar el mejor modelo utilizando el criterio adecuado Diagnóstico)
    • elegir los parámetros p y q según el AIC más bajo".

--> excel-documentación: qué parámetros se van a utilizar para arma.predicción

  1. Diagnóstico (falsificación del proceso de selección del modelo)
    • Prueba de Durbin-Watson para detectar la presencia de autocorrelación
    • trazar los residuos para ver la estructura, es decir, el ruido blanco
    • Prueba de normalidad (D'Angelo y Pearson) para ver la diferencia con la distribución normal
    • qqplot de los residuos contra los cuantiles de la distribución t (además de la prueba de normalidad)
    • trazar el ACF y el PACF de los residuos para detectar el ruido blanco
    • Prueba de Ljung-Box para comprobar la aleatoriedad general basada en un número de rezagos

--> documentación de excel: Resultados de la prueba de Durbin-Watson, resultados de la prueba de normalidad, resumen de la prueba de Ljung-Box (Q>0, ¿sí/no?)

  1. Previsión (utilizar el modelo para pronosticar)
    • modelo de ejecución
    • análisis arma.summary-table
    • comparar el valor previsto con el valor real (análisis dentro de la muestra)

--> excel-documentación: valor de predicción para valores p y q dados (ver. '3. Estimación')

  1. Verificación (error medio porcentual absoluto (MAPE) para el análisis en la muestra)
    • comparar el valor previsto con el valor real

--> documentación de excel: MAPE para valores p y q dados

  • vuelva a "3. Estimación" y ejecute de nuevo si los resultados del diagnóstico y el MAPE no son satisfactorios

  • Máximo tiempo de reejecución basado en la selección óptima del criterio de información: si el resultado del modelo no es satisfactorio, elija valores p y q más altos y más bajos. Utilice el BIC y/o el HQIC más bajos (si el AIC, el BIC y el HQIC sugieren los mismos valores p- y q, utilice un enfoque diferente)

Sería genial si alguien puede tomarse un minuto y decirme si esto suena legítimo desde un punto de vista académico.

Tanques por adelantado

0 votos

¿Qué es? punto de vista académico ? ¿Estás escribiendo un artículo?

3 votos

A mí me parece bien, pero realmente depende del objetivo del artículo académico. En cierto sentido, la metodología de Box-Jenkins es una novedad, ¡un tema de los años 70! Me imagino que la mayoría de los lectores estarán más interesados en los resultados de su investigación que en ver hasta la cocina. No es raro leer algo como "aplicando la metodología Box-Jenkins se eligió un modelo ARMA(2,1)" sin entrar en los detalles reales. Este sería sin duda el caso de la economía, donde un modelo de series temporales sólo se utilizaría como modelo de referencia. Probablemente sea más interesante comparar el rendimiento de las previsiones con los modelos rivales.

2 votos

@ Aksakal: Estoy escribiendo mi tesis de maestría

3voto

Owen Fraser-Green Puntos 642

"Preparación de los datos (identificación y diferencia de datos para obtener series estacionarias)" . La no estacionariedad puede ser el síntoma mientras que la causa puede ser un simple cambio en la media o un simple cambio en la tendencia o un simple cambio en los parámetros o un simple cambio en la varianza del error. Alternativamente/contrariamente, un valor inusual (pulso) aumentará la varianza y la covarianza, por lo que el acf estará sesgado a la baja, produciendo conclusiones posiblemente falsas sobre una estructura ARIMA inexistente. En cualquier caso, su diseño no comprende ni sigue los diagramas de flujo presentados en su referencia.

1 votos

Gracias por su respuesta. Por lo que sé, no hay cambios simples que puedan causar no estacionariedad en mis series temporales. Lo único que hago para modificar mi TS es excluir algunos días (es decir, los fines de semana y las vacaciones). Por lo tanto, la prueba de estacionariedad debería ser adecuada, ¿no cree? También podría añadir algo de suavización de datos para evitar valores inusuales (picos de precios). La referencia que utilizo para mi modelo es la siguiente enlace (El diagrama de flujo presentado en mi pregunta puede considerarse una orientación más que una referencia).

0 votos

Si dispone de datos diarios, podría pensar en un diseño que compruebe e incluya series de días de la semana, indicadores de vacaciones (de adelanto y de retraso), efectos de fin de semana largo, cambio de nivel en la media, puntos de cambio en los efectos del día de la semana. Parafraseando a un colega mío, "casi todos los problemas complicados tienen soluciones sencillas que, cuando se prueban, no funcionan demasiado bien, si es que lo hacen". Si bien su enfoque debe ser sencillo, no debe serlo demasiado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X