11 votos

Consistencia de 2SLS con variable binaria endógena

He leído que 2SLS estimador todavía es consistente, incluso con el binario variable endógena (http://www.stata.com/statalist/archive/2004-07/msg00699.html). En la primera etapa, un probit modelo de tratamiento se ejecutará en lugar de un modelo lineal.

¿Hay alguna prueba formal para demostrar que 2SLS todavía es consistente, incluso cuando la 1ª etapa es un probit o logit modelo?

También ¿qué pasa si el resultado también es binario? Entiendo que si tenemos un resultado binario y binario variable endógena (1ª y 2ª etapas son tanto binaria probit/modelos logit), imitando 2SLS método producirá una estimación inconsistente. ¿Hay alguna prueba formal de este? Wooldridge del econométricos libro tiene algunas discusión, pero yo creo que no hay pruebas rigurosas para mostrar la inconsistencia.

\begin{verbatim}

data sim; do i=1 to 500000; iv=rand("normal",0,1); x2=rand("normal",0,1); x3=rand("normal",0,1); lp=0.5+0.8*iv+0.5*x2-0.2*x3; T=rand("bernoulli",exp(lp)/(1+exp(lp))); Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1); output; end; run;

****1st stage: logit model ****; ****get predicted values ****;
proc logistic data=sim descending; model T=IV; output out=pred1 pred=p; run;

****2nd stage: ols model with predicted values****; proc reg data=pred1; model y=p; run;

\end{verbatim}

el coeficiente de p =1.19984. Sólo se ejecuta una simulación, pero con una muestra de gran tamaño.

12voto

Andy Puntos 10250

Ha habido una pregunta similar con respecto a un probit de la primera etapa y un MCO de la segunda etapa. En la respuesta que me han proporcionado un enlace a las notas que contienen una prueba formal de la inconsistencia de esta regresión que se conoce formalmente como "prohibido regresión", como fue denominado por Jerry Hausman. La principal razón de la inconsistencia de la probit primera etapa/OLS segunda etapa enfoque es que ni las expectativas del operador ni las proyecciones lineales operador de pasar a través de un no-lineal de la primera etapa. Por lo tanto, los valores ajustados de una primera etapa probit sólo están correlacionadas con la segunda etapa de término de error bajo supuestos muy restrictivos que casi nunca en la práctica. Tenga en cuenta que la prueba formal de la inconsistencia de lo prohibido de regresión es bastante elaborado, si recuerdo correctamente.

Si usted tiene un modelo de $$Y_i = \alpha + \beta X_i + \epsilon_i$$ donde $Y_i$ es un continuo de los resultados y de la $X_i$ es una binaria variable endógena, puede ejecutar la primera etapa de $$X_i = a + Z'_i\pi + \eta_i$$ a través de la OPERACIÓN y el uso de los valores ajustados $\widehat{X}_i$ en lugar de $X_i$ en la segunda etapa. Este es el modelo de probabilidad lineal que te referías. Dado que no hay ningún problema para las expectativas o proyecciones lineales para este lineales primera etapa, su 2SLS estimaciones serán consistentes aunque de manera menos eficiente de lo que podrían ser si tuviéramos que tomar en cuenta la naturaleza no lineal de $X_i$.

La consistencia de este enfoque se deriva del hecho de que mientras que un modelo no lineal pueden ajustarse a los condicional expectativas función más estrechamente limitado de variables dependientes, esto no importa mucho si usted está interesado en el efecto marginal. En el modelo de probabilidad lineal de los coeficientes de ellos mismos son los efectos marginales evaluados en la media, por lo que si el efecto marginal en la media es lo que está después (y por lo general la gente), esto es lo que quieres, dada la modelo lineal ofrece las mejores aproximaciones lineales a no-lineal de la esperanza condicional funciones.
Lo mismo ocurre si $Y_i$ es binario, también.

Para una discusión más detallada de este tener una mirada en el Kit de Baum excelentes notas de la conferencia sobre este tema. Desde la diapositiva 7 se analiza el uso del modelo de probabilidad lineal en el 2SLS contexto.

Por último, si usted realmente desea utilizar probit porque quieren más eficiente estimaciones, a continuación, hay otra forma que también se menciona en Wooldridge (2010) "Análisis Econométrico de la Sección Transversal y Datos de Panel". La anterior relacionado respuesta incluye, lo repito aquí para la integridad. Como un ejemplo aplicado ver Adams et al. (2009) que utilizan un procedimiento de tres pasos que va como sigue:

  1. uso probit para la regresión de la variable endógena en el instrumento(s) y las variables exógenas
  2. utilizar los valores previstos en el paso anterior en una OLS primera etapa, junto con la exógenos (pero sin el instrumental) variables
  3. hacer la segunda etapa, como de costumbre

Este procedimiento no caer en el prohibido regresión problema, pero potencialmente entrega más eficiente de las estimaciones del parámetro de interés.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X