Autocorrelación de procesos AR(1) independientes concatenados

Question

Autocorrelación de procesos AR(1) independientes concatenados

Preguntado el 26 de Marzo, 2016: Cuando se hizo la pregunta
218 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Dejemos que $\left\{X_t\right\}$ sea un proceso estocástico formado por la concatenación de extracciones iid de un proceso AR(1), donde cada extracción es un vector de longitud 10. En otras palabras, $\left\{X_1, X_2, \ldots, X_{10}\right\}$ son realizaciones de un proceso AR(1); $\left\{X_{11}, X_{12}, \ldots, X_{20}\right\}$ se extraen del mismo proceso, pero son independientes de las 10 primeras observaciones; etc.

¿Qué hará el ACF de $X$ -- llámalo $\rho\left(l\right)$ -- ¿parece? Estaba esperando $\rho\left(l\right)$ sea cero para los rezagos de longitud $l \geq 10$ ya que, por supuesto, cada bloque de 10 observaciones es independiente de todos los demás bloques.

Sin embargo, cuando simulo datos, obtengo esto:

simulate_ar1 <- function(n, burn_in=NA) {
    return(as.vector(arima.sim(list(ar=0.9), n, n.start=burn_in)))
}

simulate_sequence_of_independent_ar1 <- function(k, n, burn_in=NA) {
    return(c(replicate(k, simulate_ar1(n, burn_in), simplify=FALSE), recursive=TRUE))
}

set.seed(987)
x <- simulate_sequence_of_independent_ar1(1000, 10)
png("concatenated_ar1.png")
acf(x, lag.max=100)  # Significant autocorrelations beyond lag 10 -- why?
dev.off()

¿Por qué hay autocorrelaciones tan alejadas de cero después del lag 10?

Mi suposición inicial era que el burn-in en arima.sim era demasiado corto, pero obtengo un patrón similar cuando establezco explícitamente, por ejemplo, burn_in=500.

¿Qué me falta?

Editar : Tal vez el enfoque en la concatenación de AR(1)s es una distracción - un ejemplo aún más simple es este:

set.seed(9123)
n_obs <- 10000
x <- arima.sim(model=list(ar=0.9), n_obs, n.start=500)
png("ar1.png")
acf(x, lag.max=100)
dev.off()

Me sorprenden los grandes bloques de autocorrelaciones significativamente no nulas en rezagos tan largos (donde la verdadera ACF $\rho(l) = 0.9^l$ es esencialmente cero). ¿Debería?

Otra edición : tal vez todo lo que está pasando aquí es que $\hat{\rho}$ el ACF estimado, está a su vez extremadamente autocorrelacionado. Por ejemplo, aquí está la distribución conjunta de $\left(\hat{\rho}(60), \hat{\rho}(61)\right)$ cuyos valores reales son esencialmente cero ( $0.9^{60} \approx 0$ ):

## Look at joint sampling distribution of (acf(60), acf(61)) estimated from AR(1)
get_estimated_acf <- function(lags, n_obs=10000) {
    stopifnot(all(lags >= 1) && all(lags <= 100))
    x <- arima.sim(model=list(ar=0.9), n_obs, n.start=500)
    return(acf(x, lag.max=100, plot=FALSE)$acf[lags + 1])
}
lags <- c(60, 61)
acf_replications <- t(replicate(1000, get_estimated_acf(lags)))
colnames(acf_replications) <- sprintf("acf_%s", lags)
colMeans(acf_replications)  # Essentially zero
plot(acf_replications)
abline(h=0, v=0, lty=2)

Preguntado el 26 de Marzo, 2016 por Doug Kavendek

1 votos

Espero que mi respuesta te siga siendo útil, más de año y medio después. Al menos a mí me ayudó a mejorar mis conocimientos de R.

Comentado el 16 de Noviembre, 2017 por Candamir

Answer 1

1 Respuestas

Answer 2

3voto

Candamir Puntos 135

Resumen ejecutivo: Parece que está confundiendo el ruido con la verdadera autocorrelación debido al pequeño tamaño de la muestra.

Puede confirmarlo simplemente aumentando el k en su código. Vea estos ejemplos a continuación (he utilizado su mismo set.seed(987) para mantener la replicabilidad):

k=1000 (su código original)

k=2000

k=5000

k=10000

k=50000

Esta secuencia de imágenes nos dice dos cosas:

La autocorrelación después de las 10 primeras observaciones disminuye considerablemente a medida que aumenta el número de iteraciones. En efecto, con un número de iteraciones suficientemente grande, la $\hat\rho(l)$ para cualquier $l>10$ convergerá a cero. Esta es la base de mi afirmación al principio: que la autocorrelación que usted observó era simplemente ruido.
A pesar de la mencionada observación de que $\hat\rho(l)$ converge a cero para cualquier $l>10$ a medida que aumenta el número de simulaciones, $\hat\rho(l)$ para cualquier $l \le 10$ en realidad se mantiene constante en $\hat\rho(l)=\rho(l)=0.9^l$ , tal y como sugiere la construcción de su modelo.

Tenga en cuenta que me refiero a la observado autocorrelación como $\hat\rho(l)$ y al verdadero autocorrelación como $\rho(l)$ .

Respondido el 16 de Noviembre, 2017 por Candamir (135 Puntos )

1 votos

La muestra ACF está autocorrelacionada, por lo que no es blanco ruido. Aparte de eso, estoy de acuerdo, es sólo un problema de ruido / tamaño de la muestra.

Comentado el 16 de Noviembre, 2017 por Doug Kavendek

0 votos

@Adrian Tienes razón. He modificado mi respuesta en consecuencia.

Comentado el 16 de Noviembre, 2017 por Candamir

0 votos

It also becomes less and less likely to "stray" outside a confidence band -- ¿Estás seguro de que es verdad?

Comentado el 17 de Noviembre, 2017 por Doug Kavendek

Mostrar 2 comentarios más

Autocorrelación de procesos AR(1) independientes concatenados

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Autocorrelación de procesos AR(1) independientes concatenados

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: