8 votos

Hace el ajuste para superfluo variables sesgo estimaciones OLS?

La costumbre de libros de texto tratamiento de ajuste para superfluo variables en la OPERACIÓN indica que el estimador es todavía imparcial, pero puede tener mayor varianza (véase, por ejemplo, Greene, el Análisis Econométrico, 7ª ed., p. 58).

El otro día me topé en Judea Pearl tratamiento de los Simpson de la Paradoja y una buena página web que simula la forma "gradual inclusión de variables de control en un modelo de regresión cambia el signo de un estimado de asociación causal en cada paso". A mí, esto de alguna manera contradice la afirmación anterior. Yo siento que esto podría ser una muy sutil (aunque muy importante) problema, por lo que cualquier puntero a más literatura sería muy útil. Lo que más me sorprende es que Greene afirma que tiene una prueba para su evaluación.

10voto

AdamSane Puntos 1825

No hay ninguna contradicción.

El primer párrafo no habla de superfluo variables.

Si de la paradoja de Simpson se aplica, las variables no son superfluas.

5voto

Jeff Bauer Puntos 236

Considere la posibilidad de un postulado modelo de regresión lineal

$$y_i = b_0 + b_1X_{1i} + b_2X_{2i} + u_i,\;\; i=1,...,n$$

Como una cuestión de álgebra (y no estocásticos de hipótesis), el estimador de MCO en notación matricial es

$$\hat b = b + \left(\mathbf X'\mathbf X\right)^{-1}\mathbf X'\mathbf u$$

Su valor esperado condicional en el regresor de la matriz es, por tanto,

$$E\left(\hat b\mid \mathbf X\right) = b + \left(\mathbf X'\mathbf X\right)^{-1}\mathbf X'E\left(\mathbf u\mid\mathbf X \right)$$

Así: Si "exogeneidad estricta" de los regresores con respecto a que el término de error tiene, o, en otras palabras, si todos los términos de error son significa-independiente de todos los regresores,pasado, presente y futuro, (que es el punto de referencia de la asunción en el Clásico modelo de Regresión Lineal), es decir, si $E\left(\mathbf u\mid\mathbf X \right)=\mathbf 0$, vamos a tener

$$E\left(\hat b\mid \mathbf X\right) = b + \mathbf 0 \Rightarrow E(\hat b) = b$$

utilizando también la ley de expectativas iteradas.

Dado todo lo anterior, lo "superfluo variable" significa? Yo digo, que significa "ajenos" a la variable dependiente. Pero "no relacionado" debe ser traducido como "estocásticamente independientes". Pero si es independiente de la variable dependiente, es necesariamente independiente del término de error (y también lo estrictamente exógena con respecto a ella), por lo que todos los anteriores mantienen para cualquier superfluo variable también, y el estimador de MCO es imparcial, incluso si, por ejemplo, la variable $X_2$ es "superfluo" y el verdadero modelo no la contienen.

Esta es la forma en econometricians entender el problema. Ahora, con más de configuración general, "superfluo" podría significar que decir, $X_2$ es independiente de $y$ condicionada a la presencia de $X_1$ (que sospecho que está más cerca de lo que Perla tiene en mente). Aún así, mientras $X_2$ es estrictamente exógena para el término de error, el unbiasedness resultado se mantiene.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X