10 votos

¿Por qué la varianza de 2SLS es mayor que la de OLS?

... Otro problema potencial de la aplicación de la 2SLS y otros procedimientos IV es que los errores estándar de 2SLS tienden a ser "grandes". Lo que Lo que se suele querer decir con esta afirmación es que los coeficientes de la 2SLS son estadísticamente insignificantes o que los errores estándar de 2SLS son mucho más grandes que los errores estándar OLS. No es de extrañar que las magnitudes de los errores estándar de 2SLS dependen, entre otras cosas, de la calidad del instrumento o instrumentos utilizados en la estimación.

Esta cita es de "Análisis econométrico de datos transversales y de panel" de Wooldridge . Me pregunto por qué ocurre esto. Preferiría una explicación matemática.

Asumiendo la homocedasticidad para simplificar, la varianza asintótica (estimada) del estimador OLS viene dada por $$\widehat{Avar}(\hat{\beta}_{OLS}) = n\sigma^2(X'X)^{-1}$$ mientras que para el estimador 2SLS $$\widehat{Avar}(\hat{\beta}_{2SLS}) = n\sigma^2(\hat{X}'\hat{X})^{-1}$$ donde $$\hat{X} = P_zX = Z(Z'Z)^{-1}Z'X.$$

$X$ es la matriz de regresores, incluidos los endógenos, y $Z$ es la matriz de variables instrumentales.

Así que reescribiendo la varianza para 2SLS se obtiene $$\widehat{Avar}(\hat{\beta}_{2SLS}) = n\sigma^2\left(X'Z(Z'Z)^{-1}Z'X\right)^{-1}.$$

Sin embargo, no puedo concluir de las fórmulas anteriores que $\widehat{Avar}(\hat{\beta}_{2SLS}) \geq \widehat{Avar}(\hat{\beta}_{OLS})$ .

0 votos

Creo que te has olvidado de tomar la inversa en tu última expresión de Avar de 2SLS.

0 votos

Tienes razón, corregido.

0 votos

He realizado algunas pequeñas modificaciones, en particular en lo que respecta a la definición de $Z$ . Por favor, compruebe.

6voto

Christoph Hanck Puntos 4143

Decimos que una matriz $A$ es al menos tan grande como $B$ si su diferencia $A-B$ es semidefinido positivo (psd).

Una afirmación equivalente que resulta más práctica de comprobar aquí es que $B^{-1}-A^{-1}$ es psd (al igual que $a>b$ equivale a $1/b>1/a$ ).

Así que queremos comprobar que $$ X'X-X'Z(Z'Z)^{-1}Z'X $$ es psd.

Escribe $$ X'X-X'Z(Z'Z)^{-1}Z'X=X'(I-Z(Z'Z)^{-1}Z')X=X'M_ZX $$ Para comprobar que $X'M_ZX$ es psd, debemos demostrar que, para cualquier vector $d$ , $$ d'X'M_ZXd\geq0 $$ Dejemos que $c=Xd$ . Entonces, $$ c'M_Zc\geq0 $$ como $M_Z$ es una matriz de proyección simétrica e idempotente, que se sabe que es psd: escribir, utilizando la simetría y la idempotencia, $$ c'M_Zc=c'M_ZM_Zc=c'M_Z'M_Zc $$ y que $e=M_Zc$ para que $c'M_Zc=e'e=\sum_ie_i^2$ que, al ser una suma de cuadrados, debe ser no negativa.

P.D.: Dos pequeños detalles: usted se refiere a la estimado varianzas asintóticas $\widehat{Avar}(\hat\beta_j)$ . Ahora, el estimador OLS y el estimador 2SLS de $\sigma^2$ no son iguales, por lo que no veo que la clasificación deba conservarse necesariamente si estas estimaciones difieren. Además, el asintótica las desviaciones se escalan generalmente por $n$ para obtener una cantidad no degenerada como $n\to\infty$ . (Por supuesto, la escala de ambos por $n$ no afectará a la clasificación, por lo que la cuestión es un poco discutible para esta pregunta en particular).

0 votos

Muchas gracias por su respuesta. Efectivamente, la varianza asintótica debe dividirse por $n$ (corregido). Supongo que hay un error tipográfico cuando se llama $M_z$ matriz de proyección, creo que se llama matriz aniquiladora. De todos modos, ¿podría proporcionar detalles por qué $M_z$ es psd. Tampoco entiendo muy bien su punto de vista de que los estimadores OLS y 2SLS para $\sigma^2$ no son lo mismo, ¿podría explicar qué significa?

0 votos

He añadido algunos detalles. $M$ es efectivamente más conocida como la matriz aniquiladora, pero como también se proyecta sobre algún espacio (el complemento ortogonal de la imagen de $P$ ) también es una matriz de proyección.

0 votos

Gracias por la aclaración y las ediciones (no sé por qué decidí dividir por $n$ ). ¿Podría explicar su primer punto en P.S.?

4voto

Repmat Puntos 1118

Creo que esta es una de esas veces en las que es mucho más fácil mirar la configuración simple de una ecuación y una variable. Así que tehcnicamente se trata de una regresión IV y no de una 2SLS (pero el resultado sigue siendo general). Así que vamos a suponer un modelo (utilizando la notación de Wooldridge), para algunos $i$ que tenemos:

$$ y_i = \beta_0 + \beta_1 x_{i1} + u_i $$

Ahora bien, si asumimos que este modelo sigue los supuestos de Gauss-Markov entonces sabemos (ver cualquier libro de texto decente) que la varianza asintótica de $\hat\beta_1$ está dada por:

$$ Avar(\hat\beta_{OLS})=\frac{\hat\sigma^2}{SST_x} $$

Donde $SST_x$ es la suma total de cuadrados para $x$ . Si en cambio suponemos que $x$ es (posible) endegonoues, y utilizar la regresión IV con $z$ como instrumento, entonces la varianza asintótica del estimador IV es:

$$ Avar(\hat\beta_{iv}) = \frac{\hat\sigma^2}{SST_x \cdot R^2_{x,z}} $$

Desde $R^2$ está siempre entre $0$ y $1$ En este caso, el denominador del estimador IV debe ser más pequeño que el de OLS (si OLS es realmente válido).

0voto

James Shapiro Puntos 11

Sólo un comentario. Creo que está bastante claro que la estimación de la varianza de los errores es mayor cuando se utiliza 2SLS. Recordemos que OLS minimiza la estimación de esta varianza. Por lo tanto, cualquier otro estimador debería tener una estimación muestral más alta de la varianza de los errores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X