33 votos

¿Cómo entender el SARIMAX de forma intuitiva?

Estoy tratando de entender un documento sobre la previsión de la carga eléctrica, pero estoy luchando con los conceptos dentro, especialmente el SARIMAX modelo. Este modelo se utiliza para la predicción de la carga y utiliza muchos conceptos estadísticos que no entiendo (soy un estudiante de ciencias de la computación de pregrado - usted puede considerar que un laico en la estadística). No es necesario que entienda completamente cómo funciona, pero me gustaría al menos entender intuitivamente lo que está sucediendo.

He estado tratando de dividir SARIMAX en piezas más pequeñas y tratando de entender cada una de estas piezas por separado y luego ponerlas juntas. ¿Pueden ayudarme? Esto es lo que tengo hasta ahora.

Empecé con AR y MA.

AR : Autorregresivo . He aprendido lo que es una regresión y, a mi entender, simplemente responde a la pregunta: dado un conjunto de valores / puntos, ¿cómo puedo encontrar un modelo que explique estos valores? Así que tenemos, por ejemplo, la regresión lineal, que trata de encontrar una línea que puede explicar todos estos puntos. Una autoregresión es una regresión que intenta explicar los valores utilizando sus valores anteriores.

MA : Media móvil . La verdad es que estoy bastante perdido aquí. Sé lo que es una media móvil, pero el modelo de media móvil no parece tener nada que ver con la media móvil "normal". La fórmula del modelo parece torpemente similar al AR y no consigo entender ninguno de los conceptos que encuentro en internet. ¿Cuál es el propósito de la MA? ¿Cuál es la diferencia entre MA y AR?

Así que ahora tenemos ARMA. El I entonces viene de Integrado , que por lo que he entendido, simplemente sirve para permitir que el modelo ARMA tenga una tendencia, ya sea creciente o decreciente. (¿Esto equivale a decir que ARIMA permite que no sea estacionario?)

Ahora viene el S de estacional que añade periodicidad a ARIMA, que básicamente dice, por ejemplo en el caso de la previsión de la carga, que la carga se parece mucho todos los días a las 6 de la tarde.

Finalmente el X , de exógeno que básicamente permite tener en cuenta variables externas en el modelo, como las previsiones meteorológicas.

¡Por fin tenemos SARIMAX! ¿Están bien mis explicaciones? Hay que reconocer que estas explicaciones no tienen que ser rigurosamente correctas. ¿Puede alguien explicarme lo que hace MA de forma intuitiva?

18voto

Affine Puntos 1394

Como ha señalado, (1) un modelo AR relaciona el valor de una observación $x$ en el momento $t$ a los valores anteriores, con algún error: $$ x_t = \phi x_{t-1} + \varepsilon_t $$ Sustituyamos en $ x_{t-1} $ y luego $ x_{t-2} $ : $$\begin{aligned} x_t &= \phi (\phi x_{t-2} + \varepsilon_{t-1}) + \varepsilon_t \\ &= \phi^2x_{t-2} + \phi\varepsilon_{t-1} + \varepsilon_t \\ &= \phi^3x_{t-3} + \phi^2\varepsilon_{t-2} + \phi\varepsilon_{t-1} + \varepsilon_t \end{aligned} $$ Llevando eso al infinito: $$ x_t = \phi^nx_{t-n} + \phi^{n-1}\varepsilon_{t-n+1} + ... + \phi\varepsilon_{t-1}+ \varepsilon_t $$ Se puede escribir cualquier AR( estacionario) $p$ ) como un MA( $\infty$ ), aunque, por supuesto, te encuentras con una gigantesca pila de términos superpuestos con $p>1$ .

Una vez visto esto, reformulemos ahora nuestra definición (1). Un proceso AR relaciona el valor de una observación $x$ en el momento $t$ a un secuencia infinita de choques de error que decaen $\varepsilon$ de períodos de tiempo anteriores (que no observamos directamente).

Así que lo que es un proceso de AM podría estar más claro ahora. (2) Un MA( $q$ ) relaciona el valor de una observación $x$ en el momento $t$ à juste $q$ choques de error de períodos anteriores (que no observamos directamente), cuyos coeficientes pueden variar más que el decaimiento exponencial implícito en un modelo AR. Como usted observa, no tiene nada que ver con el concepto habitual de "media móvil".

Con algunas condiciones sobre los coeficientes $\theta_1...\theta_q$ de un MA( $q$ ), en realidad podemos hacer algo muy similar a lo que mostré para un proceso AR más arriba, es decir, escribir el proceso MA( $q$ ) como un AR( $\infty$ ). Así que es igual de válido replantear (2) para decir que un proceso MA relaciona el valor de una observación $x$ en el momento $t$ a una secuencia decreciente de todos los valores anteriores de $x$ .

Así que un modelo ARMA simplemente combina esas dos ideas, relacionando $x_t$ tanto a una secuencia infinita que decae como a una secuencia definida. ARIMA sólo añade la diferenciación a la mezcla, es decir, se ejecuta ARMA en $x_t - x_{t-1}$ (o más diferencias como puede ser), para eliminar la tendencia, como usted señaló.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X