Hay algunas voces fuertes en la comunidad de Econometría contra la validez del Ljung-Box $Q$ -para comprobar la existencia de autocorrelación a partir de los residuos de un modelo autorregresivo (es decir, con variables dependientes retardadas en la matriz del regresor), véase en particular Maddala (2001) "Introduction to Econometrics" (3ª edición), capítulos 6.7 y 13. 5 p 528 . Maddala lamenta literalmente el uso generalizado de esta prueba, y en su lugar considera adecuada la prueba del "multiplicador de Langrange" de Breusch y Godfrey.
El argumento de Maddala contra la prueba de Ljung-Box es el mismo que el planteado contra otra prueba de autocorrelación omnipresente, la de "Durbin-Watson": con variables dependientes rezagadas en la matriz de regresores, la prueba está sesgada a favor de mantener la hipótesis nula de "no autocorrelación" (los resultados de Monte-Carlo obtenidos en la respuesta de @javlacalle aluden a este hecho). Maddala también menciona la baja potencia de la prueba, véase por ejemplo Davies, N., y Newbold, P. (1979). Some power studies of a portmanteau test of time series model specification. Biometrika, 66(1), 153-155 .
Hayashi(2000) , ch. 2.10 "Pruebas de correlación serial" presenta un análisis teórico unificado, y creo que aclara la cuestión. Hayashi parte de cero: Para el Ljung-Box $Q$ -para que se distribuya asintóticamente como un chi-cuadrado, debe darse el caso de que el proceso $\{z_t\}$ (lo que sea $z$ representa), cuyas autocorrelaciones muestrales introducimos en el estadístico es, bajo la hipótesis nula de no autocorrelación, una secuencia de diferencia martingala, es decir, que satisface
$$E(z_t \mid z_{t-1}, z_{t-2},...) = 0$$
y también presenta una homoscedasticidad condicional "propia"
$$E(z^2_t \mid z_{t-1}, z_{t-2},...) = \sigma^2 >0$$
En estas condiciones, la Ljung-Box $Q$ -(que es una variante corregida para muestras finitas del original Box-Pierce $Q$ -), tiene asintóticamente una distribución chi-cuadrado, y su uso tiene justificación asintótica.
Supongamos ahora que hemos especificado un modelo autorregresivo (que quizás incluya también regresores independientes además de variables dependientes retardadas), digamos
$$y_t = \mathbf x_t'\beta + \phi(L)y_t + u_t$$
donde $\phi(L)$ es un polinomio en el operador de retardo, y queremos probar la correlación serial utilizando los residuos de la estimación. Así que aquí $z_t \equiv \hat u_t$ .
Hayashi muestra que para que la caja de Ljung $Q$ -estadística basada en las autocorrelaciones muestrales de los residuos, para tener una distribución asintótica chi-cuadrado bajo la hipótesis nula de no autocorrelación, debe ser el caso que todo los regresores son "estrictamente exógenos" al término de error en el siguiente sentido:
$$E(\mathbf x_t\cdot u_s) = 0 ,\;\; E(y_t\cdot u_s)=0 \;\;\forall t,s$$
El "para todo $t,s$ " es el requisito crucial aquí, el que refleja la exogeneidad estricta. Y no se mantiene cuando existen variables dependientes retardadas en la matriz de regresores. Esto es fácil de ver: fijar $s= t-1$ y luego
$$E[y_t u_{t-1}] = E[(\mathbf x_t'\beta + \phi(L)y_t + u_t)u_{t-1}] =$$
$$ E[\mathbf x_t'\beta \cdot u_{t-1}]+ E[\phi(L)y_t \cdot u_{t-1}]+E[u_t \cdot u_{t-1}] \neq 0 $$
incluso si el $X$ son independientes del término de error, y incluso si el término de error no tiene autocorrelación El término $E[\phi(L)y_t \cdot u_{t-1}]$ no es cero.
Pero este prueba que el Ljung-Box $Q$ no es válido en un modelo autorregresivo, porque no se puede decir que tenga una distribución asintótica chi-cuadrado bajo la nula.
Supongamos ahora que se cumple una condición más débil que la exogeneidad estricta, a saber, que
$$E(u_t \mid \mathbf x_t, \mathbf x_{t-1},...,\phi(L)y_t, u_{t-1}, u_{t-2},...) = 0$$
La fuerza de esta condición está "entre" la exogeneidad estricta y la ortogonalidad. Bajo el nulo de no autocorrelación del término de error, esta condición es se satisface "automáticamente" con un modelo autorregresivo, con respecto a las variables dependientes rezagadas (para el $X$ debe ser asumido por separado, por supuesto).
Entonces, existe otro estadística basada en las autocorrelaciones residuales de la muestra, ( no la de Ljung-Box), que sí tiene una distribución asintótica chi-cuadrado bajo la nula. Este otro estadístico puede calcularse, por conveniencia, utilizando la vía de la "regresión auxiliar": hacer una regresión de los residuos $\{\hat u_t\}$ sobre la matriz completa del regresor y sobre los residuos pasados (hasta el retardo que hemos utilizado en la especificación), obtener el no centrado $R^2$ de esta regresión auxiliar y multiplicarla por el tamaño de la muestra.
Este estadístico se utiliza en lo que llamamos la "prueba de Breusch-Godfrey para la correlación serial" .
Parece entonces que, cuando los regresores incluyen variables dependientes retardadas (y así también en todos los casos de modelos autorregresivos), la prueba de Ljung-Box debe ser abandonado a favor de la prueba LM de Breusch-Godfrey. no porque "funcione peor", sino porque no tiene justificación asintótica. Un resultado bastante impresionante, sobre todo a juzgar por la omnipresencia y aplicación del primero.
ACTUALIZACIÓN: En respuesta a las dudas planteadas en los comentarios sobre si todo lo anterior se aplica también a los modelos de series temporales "puros" o no (es decir, sin " $x$ "-regressors"), he publicado un examen detallado para el modelo AR(1), en https://stats.stackexchange.com/a/205262/28746 .
1 votos
Relacionado: "Prueba de Breusch-Godfrey sobre los residuos de un modelo MA(q)" .