Ha habido una pregunta similar con respecto a un probit de la primera etapa y un MCO de la segunda etapa. En la respuesta que me han proporcionado un enlace a las notas que contienen una prueba formal de la inconsistencia de esta regresión que se conoce formalmente como "prohibido regresión", como fue denominado por Jerry Hausman. La principal razón de la inconsistencia de la probit primera etapa/OLS segunda etapa enfoque es que ni las expectativas del operador ni las proyecciones lineales operador de pasar a través de un no-lineal de la primera etapa. Por lo tanto, los valores ajustados de una primera etapa probit sólo están correlacionadas con la segunda etapa de término de error bajo supuestos muy restrictivos que casi nunca en la práctica.
Tenga en cuenta que la prueba formal de la inconsistencia de lo prohibido de regresión es bastante elaborado, si recuerdo correctamente.
Si usted tiene un modelo de
$$Y_i = \alpha + \beta X_i + \epsilon_i$$
donde $Y_i$ es un continuo de los resultados y de la $X_i$ es una binaria variable endógena, puede ejecutar la primera etapa de
$$X_i = a + Z'_i\pi + \eta_i$$
a través de la OPERACIÓN y el uso de los valores ajustados $\widehat{X}_i$ en lugar de $X_i$ en la segunda etapa. Este es el modelo de probabilidad lineal que te referías. Dado que no hay ningún problema para las expectativas o proyecciones lineales para este lineales primera etapa, su 2SLS estimaciones serán consistentes aunque de manera menos eficiente de lo que podrían ser si tuviéramos que tomar en cuenta la naturaleza no lineal de $X_i$.
La consistencia de este enfoque se deriva del hecho de que mientras que un modelo no lineal pueden ajustarse a los condicional expectativas función más estrechamente limitado de variables dependientes, esto no importa mucho si usted está interesado en el efecto marginal. En el modelo de probabilidad lineal de los coeficientes de ellos mismos son los efectos marginales evaluados en la media, por lo que si el efecto marginal en la media es lo que está después (y por lo general la gente), esto es lo que quieres, dada la modelo lineal ofrece las mejores aproximaciones lineales a no-lineal de la esperanza condicional funciones.
Lo mismo ocurre si $Y_i$ es binario, también.
Para una discusión más detallada de este tener una mirada en el Kit de Baum excelentes notas de la conferencia sobre este tema. Desde la diapositiva 7 se analiza el uso del modelo de probabilidad lineal en el 2SLS contexto.
Por último, si usted realmente desea utilizar probit porque quieren más eficiente estimaciones, a continuación, hay otra forma que también se menciona en Wooldridge (2010) "Análisis Econométrico de la Sección Transversal y Datos de Panel". La anterior relacionado respuesta incluye, lo repito aquí para la integridad. Como un ejemplo aplicado ver Adams et al. (2009) que utilizan un procedimiento de tres pasos que va como sigue:
- uso probit para la regresión de la variable endógena en el instrumento(s) y las variables exógenas
- utilizar los valores previstos en el paso anterior en una OLS primera etapa, junto con la exógenos (pero sin el instrumental) variables
- hacer la segunda etapa, como de costumbre
Este procedimiento no caer en el prohibido regresión problema, pero potencialmente entrega más eficiente de las estimaciones del parámetro de interés.