5 votos

Equivalencia entre algunos métodos de Suavizado Exponencial y ARIMA

Leí de varias fuentes que ciertos métodos de suavizado exponencial (espacio de estado lineal) tienen una forma equivalente como ARIMA. Por ejemplo, el suavizado exponencial simple (SES) como ARIMA(0,1,1) y el suavizado exponencial lineal de Holt como ARIMA(0,2,2). Sin embargo, me preguntaba, si cada par de modelos son equivalentes, ¿por qué obtuve resultados diferentes de paquetes de software (por ejemplo, SPSS) al usar, digamos, SES y ARIMA(0,1,1) para ajustar el mismo conjunto exacto de datos? Si SES es verdaderamente un "caso especial" de ARIMA(0,1,1), ¿no debería SES siempre tener un rendimiento ligeramente peor (o como máximo igual, en el óptimo) que ARIMA? Observé que SES dio un mejor ajuste en varios conjuntos de datos, en comparación con ARIMA(0,1,1).

¿Tiene algo que ver con la suposición de estacionariedad?

¿Cuál es la verdadera definición de la forma de espacio de estado del suavizado exponencial? ¿Significa simplemente el modelo de suavizado exponencial con supuestos de estacionariedad y errores independientes distribuidos normalmente, con media cero? ¿Requiere algo más?

0 votos

Si el SES es realmente un "caso especial" de ARIMA(0,1,1), ¿no debería el SES siempre rendir ligeramente peor (o como máximo al mismo nivel, en la optimalidad) que ARIMA? Observé que el SES dio un mejor ajuste en varios conjuntos de datos, en comparación con ARIMA(0,1,1). La flexibilidad del modelo tiene un costo en términos de propensión al sobreajuste. Por lo tanto, un caso especial puede ser mejor para predecir que el modelo general si el modelo general sufre lo suficiente de sobreajuste.

4voto

icelava Puntos 548
  1. Las diferentes implementaciones del suavizado exponencial difieren en cómo establecen los valores iniciales del nivel, la tendencia y los componentes estacionales.

    ¿Por qué? Incluso en un marco de espacio estadístico, hay muchos parámetros que estimar (por ejemplo, dos valores iniciales para el nivel y la tendencia, doce valores iniciales para la estacionalidad mensual, más las constantes de suavizado), típicamente con datos algo limitados, si se sigue la regla empírica de alrededor de 20 observaciones por grado de libertad, se necesitarían 30 años de datos mensuales. Normalmente, sus series temporales son mucho más cortas que esto. (Y aún si tuviera 30 años de datos, la suposición razonable es que el proceso generador de datos ha cambiado en el tiempo transcurrido, a menos que se trate de datos astronómicos.)

    Como consecuencia, la mayoría de las implementaciones utilizan un enfoque mixto, estableciendo valores iniciales de manera heurística y solo utilizando una variante de máxima verosimilitud para estimar las constantes de suavizado. Y es crucial destacar que hay muchas heurísticas razonables para la primera parte, y las diferentes implementaciones diferirán en cómo lo hacen. A veces, la documentación del software es explícita sobre qué heurísticas se utilizan, pero más a menudo no lo es, y su única posibilidad es revisar el código fuente.

  2. La referencia canónica para los modelos de espacio estadístico es Hyndman, Koehler, Ord & Snyder (2008), Forecasting with Exponential Smoothing: The State Space Approach. Si realmente quieres entrar en los detalles, lo mejor es consultar directamente ese libro.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X