15 votos

Selección del modelo Box-Jenkins

El procedimiento de selección de modelos de Box-Jenkins en el análisis de series temporales comienza por examinar las funciones de autocorrelación y autocorrelación parcial de las series. Estos gráficos pueden sugerir el $p$ y $q$ en un ARMA $(p,q)$ modelo. El procedimiento continúa pidiendo al usuario que aplique los criterios AIC/BIC para seleccionar el modelo más parsimonioso entre los que producen un modelo con un término de error de ruido blanco.

Me preguntaba cómo afectan estos pasos de inspección visual y selección de modelos basada en criterios a los errores estándar estimados del modelo final. Sé que muchos procedimientos de búsqueda en un dominio transversal pueden sesgar los errores estándar a la baja, por ejemplo.

En el primer paso, ¿cómo afecta a los errores estándar de los modelos de series temporales la selección del número adecuado de rezagos al observar los datos (ACF/PACF)?

Supongo que la selección del modelo basada en las puntuaciones AIC/BIC tendría un impacto análogo al de los métodos transversales. La verdad es que tampoco sé mucho sobre este tema, así que cualquier comentario se agradecería también sobre este punto.

Por último, si escribieras el criterio preciso utilizado para cada paso, ¿podrías hacer un bootstrap de todo el proceso para estimar los errores estándar y eliminar estas preocupaciones?

0 votos

¿es tan importante el sesgo en los errores estándar (de los parámetros?) en los modelos ARMA a-teóricos? Los modelos ARMA ASFAIK se utilizan sobre todo para realizar previsiones a corto plazo. Los problemas de interpretación de los parámetros y sus propiedades son menos importantes (¿menos?). Por supuesto, si no se refiere a las características de un proceso de innovación (término de error), planeando producir intervalos de predicción relevantes.

0 votos

@Dmitrij, Hay dos razones principales por las que me preocupa el sesgo en los errores estándar de los coeficientes. La primera, como has aludido, es la creación de intervalos de predicción. La segunda es la comprobación de la existencia de rupturas estructurales en el modelo, una pregunta común a la que un economista estaría interesado en dar respuesta. Los errores estándar generados mediante un procedimiento de selección deberían ser demasiado pequeños, dando lugar a intervalos de predicción demasiado estrechos y a estadísticas de prueba demasiado grandes.

0 votos

Pero en los modelos a-teóricos (lo que significa que no hay teoría, no hay estructura), las rupturas estructurales tienen poco que ver con los parámetros sería algunas pruebas generales, en relación con el comportamiento de los residuos del modelo. Bueno en este caso las estimaciones insesgadas de los parámetros del modelo son menos importantes, ARMA simplemente no tiene interpretación de los modelos estructurales. Por lo tanto, los modelos parsimoniosos son de hecho mejores predictores, ya que equilibran bien las propiedades generalmente pobres de los estimadores de muestras pequeñas y la precisión de la predicción.

7voto

Owen Fraser-Green Puntos 642

En mi opinión, la selección del número adecuado de rezagos no difiere de la selección del número de series de entrada en un procedimiento de regresión hacia delante por pasos. La importancia incremental de los rezagos o de una serie de entrada específica es la base de la especificación tentativa del modelo.

Ya que has afirmado que el acf/pacf es la única base para la selección del modelo Box-Jenkins, déjame decirte lo que me ha enseñado la experiencia. Si una serie presenta un acf que no decae, el enfoque de Box-Jenkins (alrededor de 1965) sugiere diferenciar los datos. Pero si una serie tiene un desplazamiento de nivel, como el Datos del Nilo Entonces, la no estacionariedad "visualmente aparente" es un síntoma de estructura necesaria, pero la diferenciación no es el remedio. Este conjunto de datos de Nilo puede modelarse sin diferenciar, simplemente identificando primero la necesidad de un cambio de nivel. De forma similar, en 1960 se nos enseña que si el acf presenta una estructura estacional ( es decir valores significativos en los rezagos de s,2s,3s,...) entonces debemos incorporar un componente ARIMA estacional. A efectos de discusión, consideremos una serie que es estacionaria en torno a una media y a intervalos fijos, digamos que cada junio hay un "valor alto". Esta serie se trata adecuadamente incorporando una serie ficticia "a la antigua" de 0 y 1 (en junio) para tratar la estructura estacional. Un modelo ARIMA estacional utilizaría incorrectamente la memoria en lugar de una variable X no especificada pero en espera de ser encontrada. Estos dos conceptos de identificación/incorporación de la estructura determinista no especificada son aplicaciones directas de los trabajos de I. Chang, William Bell y George Tiao, R.Tsay , Chen y otros (a partir de 1978) bajo el concepto general de Detección de Intervenciones.

Incluso hoy en día, algunos analistas realizan estrategias de maximización de la memoria sin sentido, llamándolas ARIMA automáticas, sin reconocer que el "modelado de memoria sin sentido" supone que la estructura determinista, como los pulsos, los cambios de nivel, los pulsos estacionales y las tendencias temporales locales, no existen o, peor aún, no desempeñan ningún papel en la identificación del modelo. Esto es como meter la cabeza en la arena, en mi opinión.

0 votos

Gracias por los excelentes consejos sobre la selección del modelo, pero me interesaba saber cómo afecta este proceso a nuestra inferencia posterior.

0 votos

Charlie: No creo que los diagnósticos de datos por adelantado, como la revisión de las autocorrelaciones o las correlaciones cruzadas o cualquier otro procedimiento de identificación de modelos como las presentaciones gráficas, tengan ningún efecto sobre la significación estadística de los parámetros estimados. Esta es mi opinión y "aquí no puedo hacer otra cosa". Gracias por los elogios y si puedo ayudar al joven Charlie de alguna manera, por favor póngase en contacto conmigo, ya que me encanta aparecer como un recurso de apoyo (¡no remunerado!) en las tesis doctorales.

6voto

Senseful Puntos 116

Cualquier procedimiento de selección de modelos afectará a los errores estándar y esto casi nunca se tiene en cuenta. Por ejemplo, los intervalos de predicción se calculan condicionados al modelo estimado y la estimación de los parámetros y la selección del modelo suelen ignorarse.

Debería ser posible realizar un bootstrap de todo el procedimiento para estimar el efecto del proceso de selección del modelo. Pero recuerde que el bootstrap de series temporales es más complicado que el bootstrap normal porque hay que preservar la correlación serial. El bootstrap de bloques es un enfoque posible, aunque pierde algo de correlación serial debido a la estructura de bloques.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X