7 votos

¿Cómo puedo asegurar PROC ARIMA es la realización de la correcta parametrización de las variables de entrada?

Estoy tratando de pronóstico utilizando ARIMAX con dos exógenos (de entrada) de las variables. Estoy usando PROC ARIMA, pero no puedo averiguar de la SAS documentación si mi código es el que produce la parametrización quiero.

Quiero extender un ARI(12,1) modelo, por lo que también incluye los últimos 12 términos de cada una de las dos variables exógenas en mi pronóstico. Por lo tanto, VariableX con las dos variables exógenas VariableY y VariableZ, mi mejor intento en el código es:

proc arima;
  identify var=VariableY(1) nlag=24;
  estimate p=12;
  identify var=VariableZ(1) nlag=24;
  estimate p=12;
  identify var=VariableX(1) nlag=24 crosscorr=( VariableY(1) VariableZ(1) );
  estimate p=12 input=( VariableY VariableZ );
  forecast id=MonthNumber interval=month alpha=.05 lead=24;
  run;
quit;

La documentación que me lleva a creer que las primeras cuatro líneas del procedimiento son necesarios para establecer el pronóstico en la final. Pero cuando voy a ejecutar el procedimiento, el resultado parece mostrar un pronóstico utilizando sólo el último término de cada una de las dos variables exógenas.

En resumen, me gustaría estar seguro de que cada uno de los siguientes son controlados:

  • El$p$$AR(p)$, y del mismo modo para cada una de las variables exógenas
  • El$d$$I(d)$, y del mismo modo para cada una de las variables exógenas
  • El$q$$MA(q)$, y del mismo modo para cada una de las variables exógenas

4voto

Oded Puntos 271275

La especificación de las Variables de Entrada de los Modelos ARIMA

El ARIMA Procedimiento utiliza los resultados de la primera pareja(s) de identify y estimate consolidados (es decir, el identify y estimate declaraciones de las variables de entrada) para crear modelos para pronosticar los valores de la variable de entrada(s) (también llamada variable exógena(s)) después de que el último punto en el tiempo que cada una de las variables de entrada son observados. En otras palabras, esas declaraciones especificar los modelos que se utilizan siempre que los valores de las variables de entrada son necesarios para períodos aún no observado.

Por lo tanto, el modelo de la VariableY se especifica como

identify var=VariableY(PeriodsOfDifferencing);
estimate p=OrderOfAutoregression q=OrderOfMovingAverage;

donde VariableY es modelada como $ARIMA(p,d,q)$ $p$ = OrderOfAutoregression, $d$ = el orden de la diferenciación (determinado a partir de PeriodsOfDifferencing), y $q$ = OrderOfMovingAverage.

La especificación de Diferenciación para el Principal y Entrada de la Serie en el Modelo ARIMAX

El orden(s) de la diferenciación para aplicar a las variables de entrada se especifican en la crosscorr ; para el modelado VariableX con entradas VariableY y VariableZ, el SAS código es:

identify var=VariableX(DifferencingX) crosscorr=( VariableY(DifferencingY) VariableZ(DifferencingZ) );

donde DifferencingX, DifferencingYy DifferencingZ son los período(s) de diferenciación para VariableX, VariableYy VariableZ, respectivamente.

Especificar el Orden de Autorregresión y el Orden de la Media móvil para el Principal y Entrada de la Serie en el Modelo ARIMAX

El número de entrada de la variable de rezagos a incluir en el modelo se especifica en la función de transferencia (en input opción). El principio de la estimate línea establece el orden de autorregresión de promedio móvil de la serie principal (es decir, la serie para que un modelo o pronósticos son, en definitiva, de ser solicitado):

estimate p=AutoregressionX q=MovingAverageX

donde VariableX es modelada como $ARIMAX(p,d,q,b)$ $p$ = AutoregressionX y $q$ = MovingAverageX.

El input opción en el mismo estimate declaración establece el orden de autorregresión de promedio móvil para el modelo ARIMAX. El numerador factores para que una función de transferencia para una entrada de la serie son como la MA parte de la ARMA de modelo para el ruido de la serie. El denominador factores para que una función de transferencia para una entrada de la serie son como el AR parte de la ARMA de modelo para el ruido de la serie. (Todos los ejemplos de abajo simplificar el ejemplo de una entrada de la serie VariableY en lugar de mostrar los dos VariableY y VariableZ.)

Cuando se especifica sin ningún numerador o el denominador términos, la variable de entrada es tratada como una pura regresión plazo (es decir, el valor de la variable de entrada en el periodo actual se utiliza sin ningún tipo de lag, si es la proyección de la variable de entrada del modelo ARIMA o ya presente como un valor observado en la serie de entrada): estimate...input=( VariableY );.

Numerador términos se representan entre paréntesis antes de la variable de entrada. estimate...input=( (1 2 3) VariableY ); produce una regresión en VariableY, LAG(VariableY), LAG2(VariableY)y LAG3(VariableY).

Denominador términos están representados en parenetheses después de una barra y antes de la variable de entrada. estimate...input=( \ (1) VariableY ); estima que el efecto de la VariableY como un infinito distribuido lag modelo exponencialmente con la disminución de los pesos.

Inicial cambio está representado antes de un signo de dólar; estimate...input=( k $ ( $\omega$-gal ) / ( $\delta$-gal ) VariableY ); representa la forma $B^k \cdot \left(\frac{\omega (B)}{\delta (B)}\right) \cdot \text{VariableY}_t$. El valor de k será añadido a que el exponente de a $B$ para todo el numerador y el denominador términos. El uso de un AR-como el cambio en la variable de entrada sin la inclusión de la onu-shifted (es decir, de la onu quedado puro o de regresión) largo plazo, el uso de este operador en lugar de numerador términos entre paréntesis. Por ejemplo, para establecer un 6, 12, y 18 meses de cambio en la serie de entrada VariableY sin la onu desplazado a término, la declaración sería estimate...input=( 6 $ (6 12) VariableY ); (esto se traduce en turnos de 6, 6 + 6 (es decir, 12), y 6 + 12 (es decir, 18)).

Resumen

El primer par(s) de identify y estimate de las declaraciones se utilizan para preparar los necesarios valores de predicción para la variable de entrada(s).

El último par de identify y estimate declaraciones de ejecutar el actual modelo ARIMAX, y el uso de valores de predicción para la variable de entrada(s) (generados a partir de la primera pareja(s) de identify y estimate declaraciones) cuando sea necesario.

La relación entre las principales variables y la variable de entrada(s) que se especifica en la crosscorr opción de la identify declaración y el input opción de la estimate declaración. La relación entre las principales variables y la variable de entrada(s) se puede definir como un run-of-the-mill de regresión de la relación; o puede ser definido con la diferenciación, AR término(s), y/o MA término(s).

Atribución

Aunque esta respuesta es mía, yo era capaz de llegar con la respuesta basada en la sustancial ayuda (y a algunas citas) oficial de los SAS documentación ("El ARIMA Procedimiento: Racional Funciones de Transferencia y Distribuido Lag Modelos", "El ARIMA Procedimiento: la Especificación de las Entradas y las Funciones de Transferencia", "El ARIMA Procedimiento: Variables de Entrada y de Regresión con ARMA Errores", y "La ARIMA Procedimiento: Diferenciación"), y desde la dirección se encuentra en esta respuesta y comentarios por IrishStat.

-1voto

Owen Fraser-Green Puntos 642

He revisado la salida y la previsión refelects un AR(12) en el término de error que se traduce en un período de 12 ponderado de previsión de uso de los últimos 12 valores de la serie de predictores como la AR polinomio actúa como un multiplicador a través de todas las series ( X,Y,Z ). Sin llegar a entrar en gran detalle , el modelo de especificación o más bien la falta de especificación en mi opinión, es "insuficiente". Por desgracia, el SAS procedimiento se supone que la diferenciación de los operadores necesarios para hacer que el original de la serie estacionaria es la misma que la diferenciación de los operadores en la Función de Transferencia. Además, el ARIMA componente en la Función de Transferencia es la misma que la ARIMA componente para el Análisis Univariado de la variable dependiente. Esta estructura debe ser identificado de forma que los residuos de un personal debidamente formado Función de Transferencia que no tiene una estructura ARIMA. Por último, su especificación ( por defecto ) de la ARIMA componente en la Función de Transferencia es un "factor común". Lo que usted necesita hacer es identificar las formas de diferenciación ( si alguna ) para las tres series y la naturaleza de la respuesta (PDL/ADL/GAL ESTRUCTURA) para CADA una de las dos entradas. Después de la estimación de un modelo tentativo compruebe que no hay ningún Nivel de Turnos/Hora Local de las Tendencias de Temporada o 1 hora de Impulsos en el conjunto provisional de los errores del modelo a través de Interevention los sistemas de Detección. Además uno debe asegurar que los errores del modelo tienen varianza constante y que los parámetros del modelo no ha demostrado haber cambiado con el tiempo y que la acf de los errores del modelo está libre de cualquier estructura significativa Y que estos errores no están correlacionados con cualquiera de los dos pre-blanqueado de entrada de la serie.

En resumen, usted está consiguiendo lo que quiere, pero usted puede no querer lo que usted está consiguiendo !Usted podría considerar la publicación de los datos originales de las tres series y tener la lista de miembros ( incluido yo mismo ) ayuda en la construcción de una mínimamente suficiente modelo.

EDIT: he encontrado un poco de material en la web que pueden ser de ayuda para usted.

Para la ilustración, la no-cero lags son 2 y 4. El proceso podría ser estimada como sigue utilizando una x como una variable de entrada.

estimación de entrada=( 2$(2) x )

La entrada es de la forma cB*2+ dB*4 = B*2( c + dB*2). Es esta última forma la que da la forma de la instrucción de entrada

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X