Cuando hay un error de medición en la variable independiente, tengo entendido que los resultados estarán sesgados en contra 0. Cuando la variable dependiente se mide con error dicen que sólo afecta al estándar de los errores, pero esto no tiene mucho sentido para mí, porque estamos estimar el efecto de la $X$ no en el original de la variable $Y$, pero en algunos otros $Y$, además de un error. Entonces, ¿cómo es que esto no afecta a las estimaciones? En este caso, es posible también el uso de variables instrumentales para eliminar este problema?
Respuesta
¿Demasiados anuncios?Cuando se desea estimar un modelo simple como $$Y_i = \alpha + \beta X_i + \epsilon_i$$ y en lugar de la verdadera $Y_i$ sólo observar con algunos de error $\widetilde{Y}_i = Y_i + \nu_i$ que es tal que no tiene correlación con el$X$$\epsilon$, si la regresión $$\widetilde{Y}_i = \alpha + \beta X_i + \epsilon_i$$ el estimado de $\beta$ es $$ \begin{align} \widehat{\beta} &= \frac{Cov(\widetilde{Y}_i,X_i)}{Var(X_i)} \newline &= \frac{Cov(Y_i + \nu_i,X_i)}{Var(X_i)} \newline &= \frac{Cov(\alpha + \beta X_i + \epsilon_i + \nu_i,X_i)}{Var(X_i)} \newline &= \frac{Cov(\alpha ,X_i)}{Var(X_i)} + \beta\frac{Cov(X_i,X_i)}{Var(X_i)} + \frac{Cov(\epsilon_i,X_i)}{Var(X_i)} + \frac{Cov(\nu_i,X_i)}{Var(X_i)} \newline &= \beta \frac{Var(X_i)}{Var(X_i)} \newline &= \beta \end{align} $$ debido a que la covarianza entre una variable aleatoria y una constante ($\alpha$) es cero, así como las covarianzas entre las $X_i$ $\epsilon_i, \nu_i$ dado que se supone que ellos no están correlacionados.
Así que usted puede ver que su coeficiente es constantemente estimado. La única preocupación es que $\widetilde{Y}_i = Y_i + \nu_i = \alpha + \beta X_i + \epsilon_i + \nu_i$ le da un término adicional en el error, el cual reduce el poder de su análisis estadísticos. En los casos muy graves de tal error de medición en la variable dependiente, usted no puede encontrar un efecto significativo a pesar de que podría estar allí en realidad. En general, variables instrumentales no le ayudará en este caso, ya que tienden a ser aún más imprecisa de OLS y que sólo puede ayudar con el error de medición en la variable explicativa.