15 votos

¿Es identificado sólo 2SLS mediana-imparcial?

En su Mayoría Inofensivas Econometría: Un Empirista del Compañero (Angrist y Pischke, 2009: 209) leí la siguiente:

(...) De hecho, sólo identificado 2SLS (es decir, la simple Wald estimador) es de aproximadamente imparcial. Esto es difícil de demostrar formalmente porque sólo identificado 2SLS no tiene momentos (es decir, la distribución de muestreo ha colas de grasa). Sin embargo, incluso con la debilidad de los instrumentos, sólo identificado 2SLS es de aproximadamente centrados en donde debe estar. Por lo tanto, decir que sólo identificado 2SLS es la mediana de la imparcial. (...)

Aunque los autores dicen que sólo identificado 2SLS es la mediana de la imparcial, ni demostrar ni proporcionar una referencia para una prueba. En la página 213 mencionar que la proposición de nuevo, pero con referencia a una prueba. También, no puedo encontrar la motivación para la proposición en sus notas de la conferencia en variables instrumentales del MIT, página 22.

La razón puede ser que la proposición es falsa, ya que lo rechazan en una nota en su blog. Sin embargo, sólo identificado 2SLS es aproximadamente la mediana imparcial, escriben. Ellos se motivan esta utilizando un pequeño Monte-Carlo experimento, pero no proporcionan ninguna prueba analítica o de forma cerrada, la expresión del término de error asociado con la aproximación. De todos modos, este fue de los autores de respuesta para el profesor Gary Solon de la Universidad Estatal de Michigan que hizo el comentario de que sólo identificado 2SLS es no median-imparcial.

Pregunta 1: ¿Cómo se puede demostrar que sólo identificado 2SLS es no median-imparcial como Gary Solon sostiene?

Pregunta 2: ¿Cómo se puede demostrar que sólo identificado 2SLS es aproximadamente la mediana de la imparcial como Angrist y Pischke sostiene?

Para la Pregunta 1 estoy buscando un contraejemplo. Para la Pregunta 2 yo soy (principalmente) en busca de una prueba o una referencia a una prueba.

También estoy buscando una definición formal de la mediana de la imparcial en este contexto. Entiendo el concepto de la siguiente manera: Un estimador $\hat{\theta}(X_{1:n})$ $\theta$ basado en algunos de $X_{1:n}$ $n$ variables aleatorias es la mediana de la imparcial para $\theta$ si y sólo si la distribución de los $\hat{\theta}(X_{1:n})$ mediana $\theta$.


Notas

  1. En un modelo identificado el número de regresores endógenos es igual al número de instrumentos.

  2. El marco describe un solo identificado variables instrumentales modelo puede ser expresado de la siguiente manera: El modelo causal de los intereses y la primera etapa de la ecuación $$\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{casos}\etiqueta{1}$$ where $X$ is a $k\times n+1$ matrix describing $k$ endogenous regressors, and where the instrumental variables is described by a $k\times n+1$ matrix $Z$. Here $W$ just describes some number of control variables (e.g., added to improve precision); and $u$ and $v$ son los términos de error.

  3. Estimamos $\beta$ $(1)$ usando 2SLS: en primer lugar, la regresión $X$ $Z$ control para $W$ y adquirir los valores pronosticados $\hat{X}$; esto se llama la primera etapa. En segundo lugar, la regresión $Y$ $\hat{X}$ control para $W$; esto se llama la segunda etapa. El coeficiente aproximado en $\hat{X}$ en la segunda etapa es nuestro 2SLS estimación de $\beta$.

  4. En el caso más simple, el modelo $$y_i=\alpha+\beta x_i+u_i$$ and instrument the endogenous regressor $x_i$ with $z_i$. In this case, the 2SLS estimate of $\beta$ is $$\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},$$ where $s_{AB}$ denotes the sample covariance between $A$ and $B$. We may simplify $(2)$: $$\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}$$ where $\bar{y}=\sum_iy_i/n$, $\bar{x}=\sum_i x_i/n$ and $\bar{u}=\sum_i u_i/n$, where $$ n es el número de observaciones.

  5. He hecho una búsqueda en la literatura el uso de las palabras "just-identificado" y "la mediana de la imparcial" para encontrar las referencias de responder la Pregunta 1 y 2 (ver arriba). Yo no he encontrado ninguna. Todos los artículos que he encontrado (ver más abajo) hacer una referencia a Angrist y Pischke (2009: página 209, 213) cuando afirma que sólo identificado 2SLS es la mediana de la imparcial.

    • Jakiela, P. De Miguel, E., & Te Velde, V. L. (2015). Te lo has ganado: estimar el impacto del capital humano en las preferencias sociales. La Economía Experimental, 18(3), 385-407.
    • Una, W. (2015). Variables instrumentales estimaciones de los efectos de par en redes sociales. La Investigación En Ciencias Sociales, 50, 382-394.
    • Vermeulen, W., & Van Ommeren, J. (2009). ¿Planificación de uso de tierras de la forma de las economías regionales? Un análisis simultáneo de la oferta de vivienda, la migración interna y local, el crecimiento del empleo en los países Bajos. Revista de Economía de la Vivienda, 18(4), 294-310.
    • Aidt, T. S., & León, G. (2016). La democrática ventana de oportunidad: la Evidencia de disturbios que se produjeron en el África Subsahariana. Diario de Resolución de Conflictos, 60(4), 694-717.

8voto

Andy Puntos 10250

En los estudios de simulación el término mediana de sesgo se refiere a que el valor absoluto de las desviaciones de un estimador de su verdadero valor (que se conoce en este caso porque se trata de una simulación para que elija el valor true). Se puede ver un documento de trabajo preparado por los Jóvenes (2017) , quien define la mediana de sesgo como esta en la tabla 15, o Andrews y Armstrong (2016) que la parcela mediana de sesgo de los gráficos de los distintos estimadores en la figura 2.

Parte de la confusión (también en la literatura) parece venir del hecho de que hay dos diferentes problemas subyacentes:

  1. débil instrumentos
  2. muchos (potencialmente) debilidad de los instrumentos de

El problema de tener un débil instrumento en un solo identificados de la configuración es muy diferente de tener muchos instrumentos, algunos son débiles, sin embargo, los dos problemas son arrojados juntos a veces.

Primero de todo, vamos a considerar la relación entre los estimadores que estamos hablando aquí. Theil (1953) en "la Estimación Simultánea y la Correlación en la Ecuación Completa de los Sistemas de" introdujo el denominado " $\kappa$- klass estimador: $$ \widehat{\beta} = \left[ X'(I-\kappa M_Z)X \right)^{-1}\left[ X'(I-\kappa M_Z)_y) \right] $$

con $M_Z = I-Z(Z'Z)^{-1}Z'$, para el sistema de ecuaciones $$ \begin{align} y &= X\beta + u \\ X &= Z\pi + e. \end{align} $$

El escalares $\kappa$ determina qué estimador tenemos. Para $\kappa = 0$ ir de nuevo a la OPERACIÓN, para $\kappa = 1$ tiene el 2SLS estimador, y al $\kappa$ está puesta a la raíz más pequeña de $\det (X'X - \kappa X'M_ZX))=0$ tiene el LIML estimador (consulte Stock y Yogo, 2005, pág. 111)

Asintóticamente, LIML y 2SLS tienen la misma distribución, sin embargo, en muestras pequeñas, esto puede ser muy diferente. Este es especialmente el caso cuando tenemos muchos instrumentos, y si algunos de los débiles. En este caso, LIML se comporta mejor que 2SLS. LIML aquí ha demostrado ser mediana imparcial. Este resultado proviene de un montón de estudios de simulación. Generalmente los papeles indicando este resultado se refieren a Rothberg (1983) "Asintótico de las Propiedades de Algunos Estimadores De los Modelos Estructurales", Sawa (1972), o Anderson et al. (1982).

Steve Pischke proporciona una simulación para este resultado en su 2016 notas de la diapositiva 17, que muestra la distribución de OLS, LIML y 2SLS con 20 instrumentos de los cuales sólo uno es realmente útil. El verdadero valor de coeficiente es 1. Usted ve que LIML está centrada en el valor verdadero, mientras que 2SLS está sesgada hacia OLS. enter image description here

Ahora el argumento parece ser el siguiente: dado que LIML puede ser demostrado ser mediana imparcial y que en el caso identificado (una variable endógena, un instrumento) LIML y 2SLS son equivalentes, 2SLS también debe ser mediana imparcial.

Sin embargo, parece que la gente de nuevo son la mezcla de la "débil instrumento" y los "muchos de los débiles instrumentos" caso porque en el identificado la configuración de ambos LIML y 2SLS va a ser parcial cuando el instrumento es débil. No he visto ningún resultado, donde se demostró que LIML es imparcial en el caso identificado cuando el instrumento es débil y no creo que esto es cierto. Una conclusión similar llega de Angrist y Pischke (2009) respuesta a Gary en Solitario en la página 2, donde simulan el sesgo de OLS, 2SLS, y LIML cuando se cambia la fuerza del instrumento. enter image description here

Para las más pequeñas de la primera fase de los coeficientes de <0.1 (manteniendo el error estándar fijo), es decir, los bajos instrumento de fuerza, sólo identificado 2SLS (y, por tanto, sólo identificado LIML) está mucho más cerca de la probabilidad límite de la estimador OLS como en comparación con el verdadero valor de coeficiente de 1.

Una vez que la primera etapa del coeficiente de entre 0,1 y 0,2, se nota que la primera etapa de la estadística F es superior a 10 y de ahí que no haya débil instrumento problema más de acuerdo con la regla de oro de F>10 por Stock y Yogo (2005). En este sentido, no puedo ver cómo LIML se supone para ser una solución para un débil instrumento problema en el caso identificado. También observe que i) LIML tiende a ser más dispersa y requiere una corrección de sus errores estándar (ver Bekker, 1994) y ii) si el instrumento es realmente débil, no encontrará nada en la segunda etapa, ni con 2SLS ni LIML debido a los errores estándar son sólo va a ser demasiado grande.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X