3 votos

Elección de un estimador robusto para tener en cuenta el error de medición en la variable dependiente

Tengo un modelo de regresión transversal $\hat{Y}_i = a + bX_i + e_i$ estimado sobre 200 observaciones transversales. El $\hat{Y}_i$ se generaron en 200 regresiones de series temporales, por lo que el error de medición también lo es. Supongamos que el error de medición puede modelarse mediante $\hat{Y}_i = Y_i - u_i$ con $u_i \sim N(0,\sigma^2)$ . Entonces tenemos $Y_i - u_i = a + b X_i + e_i$ .. $\Rightarrow$ .. $Y_i = a + b X_i + (e_i + u_i) = Y_i = a + b X_i + \epsilon_i$ , donde $(e_i + u_i) = \epsilon_i$ . Esto significa que la diagonal de la matriz de covarianza de la varianza residual es mayor. La matriz de covarianza de la varianza viene dada por $\Sigma = E[\epsilon \epsilon^T]$ bajo esta expresión, cada elemento de la diagonal en $E[\epsilon \epsilon^T]$ es mayor que cada elemento diagonal de $E[e e^T]$ . Dada la fórmula de la matriz de covarianza de los coeficientes, los SE de los coeficientes serán mayores de $E[\epsilon \epsilon^T](X^T X)^{-1}$ que de $[e e^T](X^T X)^{-1}$ , lo que lleva a que los errores de tipo 2 sean más abundantes.

Otra forma de expresar este problema es la siguiente. Supongamos que $u_i$ y $e_i$ no están correlacionados, tenemos $var(e_i + u_i) = var(\epsilon_i) = \sigma_e^2 + \sigma_u^2 > var(e_i) = \sigma_e^2$ ... Los errores estándar de nuestros coeficientes serán incorrectamente grandes..

Diapositiva 4 de ESTE describe el problema (pero no da recetas).

Entonces, ¿qué estimador utilizo para reducir el caso de poder débil / grandes errores de tipo 2 en este modelo econométrico?

3voto

mat_geek Puntos 1367

En este caso, no es necesario realizar el arranque. El problema parece ser un error en la variable X aunque no es así como has descrito el problema. Si se trata de un problema de error en las variables, el remedio es utilizar el criterio de optimización adecuado, que no es el de mínimos cuadrados. Los mínimos cuadrados son apropiados cuando todo el error en los pares observados se debe a las Y. La respuesta es minimizar la distancia cuadrada en una dirección basada en la relación entre la varianza del error en X y la varianza del error en Y. Si las dos varianzas del error son iguales, esto sería minimizar el error cuadrado en la dirección ortogonal a la línea. El error en la regresión de variables se trata en varios textos.

Pero tal y como lo describes todo el error de medición está en Y y aunque afirmas tener dos conjuntos de errores e $_i$ y u $_i$ cada una con media 0, la varianza residual de los mínimos cuadrados estimará la varianza de u $_i$ + e $_i$ y no harías nada diferente de lo que harías normalmente.

Así que creo que no debes estar planteando tu problema correctamente. En cualquiera de estas situaciones de modelización se podría realizar un bootstrap de las muestras y obtener estimaciones de bootstrap, pero si la distribución de errores es normal y se tiene una regresión de errores en variables o una regresión de mínimos cuadrados ordinarios, no es necesario hacerlo.

Después de mirar las diapositivas veo que mi explicación es correcta. Pero ellos afirman que quieren estimar la varianza de e $_i$ en lugar de e $_i$ + u $_i$ . Por desgracia, no hay forma de descomponer el error para obtener la estimación. Es un problema sin solución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X