He encontrado dos definiciones en la literatura para el tiempo de autocorrelación de una serie temporal débilmente estacionaria:
$$ \tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right| $$
où $\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]}$ es la autocorrelación en el retardo $k$ .
Una aplicación del tiempo de autocorrelación es encontrar el "tamaño efectivo de la muestra": si se tiene $n$ observaciones de una serie temporal, y se conoce su tiempo de autocorrelación $\tau$ Entonces puedes fingir que tienes
$$ n_\text{eff} = \frac{n}{\tau} $$
muestras independientes en lugar de $n$ correlacionados a efectos de encontrar la media. Estimación de $\tau$ de los datos no es trivial, pero hay algunas formas de hacerlo (véase Thompson 2010 ).
La definición sin valores absolutos, $\tau_a$ parece más común en la literatura; pero admite la posibilidad de $\tau_a<1$ . Utilizando R y el paquete "coda":
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
La función "effectiveSize" en "coda" utiliza una definición del tiempo de autocorrelación equivalente a $\tau_a$ , arriba. Hay algunos otros paquetes de R que calculan el tamaño efectivo de la muestra o el tiempo de autocorrelación, y todos los que he probado dan resultados consistentes con esto: que un proceso AR(1) con un coeficiente AR negativo tiene más muestras efectivas que las series temporales correlacionadas. Esto parece extraño.
Obviamente, esto nunca puede ocurrir en el $\tau_b$ definición de tiempo de autocorrelación.
¿Cuál es la definición correcta de tiempo de autocorrelación? ¿Hay algún error en mi comprensión del tamaño efectivo de las muestras? El $n_\text{eff} > n$ El resultado que se muestra arriba parece que debe ser erróneo... ¿qué está pasando?
1 votos
Sólo para asegurarme de que no he entendido mal, ¿no se supone que eso es $Cov(X_t,X_{t+k})$ en lugar del $h$ ?
2 votos
Me interesa la segunda definición, es decir, $\tau_b$ . ¿Podría facilitar la bibliografía donde lo encontró?
0 votos
Tienes razón @sachinruk, debería estar indexado con k.