20 votos

¿Cuál es la varianza a largo plazo?

¿Cómo se define la varianza a largo plazo en el ámbito del análisis de series temporales?

Entiendo que se utiliza en el caso de que exista una estructura de correlación en los datos. Así que nuestro proceso estocástico no sería una familia de $X_1, X_2 \dots$ variables aleatorias i.i.d. sino sólo idénticamente distribuidas?

¿Podría disponer de una referencia estándar como introducción al concepto y a las dificultades que entraña su estimación?

0 votos

24voto

Christoph Hanck Puntos 4143

Es una medida del error estándar de la media muestral cuando existe dependencia serial.

Si $Y_t$ es covarianza estacionaria con $E(Y_t)=\mu$ y $Cov(Y_t,Y_{t-j})=\gamma_j$ (¡en un entorno iid, esta cantidad sería cero!) tal que $\sum_{j=0}^\infty|\gamma_j|<\infty$ . Entonces $$\lim_{T\to\infty}\{Var[\sqrt{T}(\bar{Y}_T- \mu)]\}=\lim_{T\to\infty}\{TE(\bar{Y}_T- \mu)^2\}=\sum_{j=-\infty}^\infty\gamma_j=\gamma_0+2\sum_{j=1}^\infty\gamma_j,$$ donde la primera igualdad es definitoria, la segundo un poco más difícil de establecer y la tercera una consecuencia de la estacionariedad, que implica que $\gamma_j=\gamma_{-j}$ .

Así que el problema es, efectivamente, la falta de independencia. Para verlo más claro, escribamos la varianza de la media muestral como \begin{align*} E(\bar{Y}_T- \mu)^2&=E\left[(1/T)\sum_{t=1}^T(Y_t- \mu)\right]^2\\ &=1/T^2E[\{(Y_1- \mu)+(Y_2- \mu)+\ldots+(Y_T- \mu)\}\\ &\quad\{(Y_1- \mu)+(Y_2- \mu)+\ldots+(Y_T- \mu)\}]\\ &=1/T^2\{[\gamma_0+\gamma_1+\ldots+\gamma_{T-1}]+[\gamma_1+\gamma_0+\gamma_1+\ldots+\gamma_{T-2}]\\ &\quad+\ldots+[\gamma_{T-1}+\gamma_{T-2}+\ldots+\gamma_1+\gamma_0]\} \end{align*}

Un problema con la estimación de la varianza a largo plazo es que, por supuesto, no observamos todas las autocovarianzas con datos finitos. Para ello se utilizan estimadores kernel (en econometría, estimadores "Newey-West" o HAC),

$$ \hat{J_T}\equiv\hat{\gamma}_0+2\sum_{j=1}^{T-1}k\left(\frac{j}{\ell_T}\right)\hat{\gamma}_j $$ $k$ es un kernel o función de ponderación, el $\hat\gamma_j$ son las autocovarianzas muestrales. $k$ entre otras cosas debe ser simétrica y tener $k(0)=1$ . $\ell_T$ es un parámetro de ancho de banda.

Un núcleo popular es el núcleo Bartlett $$k\left(\frac{j}{\ell_T}\right) = \begin{cases} \bigl(1 - \frac{j}{\ell_T}\bigr) \qquad &\mbox{for} \qquad 0 \leqslant j \leqslant \ell_T-1 \\ 0 &\mbox{for} \qquad j > \ell_T-1 \end{cases} $$ Buenas referencias de libros de texto Hamilton, Análisis de series temporales o Fuller . Un artículo seminal (pero técnico) de una revista es Newey y West, Econometrica 1987 .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X