Tengo una pregunta sobre las restricciones de exclusión en el diseño de variables instrumentales. Si tengo una variable instrumental, que también está relacionada de alguna manera con el resultado, ¿causaría eso (y cómo) problemas? ¿Sesgaría de alguna manera el efecto medio local del tratamiento? Además, ¿cómo se estima este efecto LATE? Estoy completamente confundido. Un simple ejemplo numérico me ayudaría a entenderlo.
Respuesta
¿Demasiados anuncios?Si los instrumentos no están predeterminados, el estimador intravenoso es inconsistente. Si los instrumentos también son débiles, esta inconsistencia puede ser más grave que la del estimador OLS.
Considere el modelo simple y=δ0+δ1z+ϵ, donde x es un instrumento para z . Supongamos que observamos una muestra de identificación (yi,zi,xi),i=1,…,n. Entonces, el error de estimación del estimador IV satisface, usando el LLN, \begin {eqnarray*} \widehat { \delta }_{{{{IV}}- \delta &=&(X'Z)^{-1}X' \varepsilon\\ &=& \frac {1}{ \frac {1}{n} \sum_ {i=1}^nx_iz_i- \frac {1}{n} \sum_ {i=1}^nz_i \frac {1}{n} \sum_ {i=1}^nx_i} \left (% \begin {array}{cc} \frac {1}{n} \sum_ {i=1}^nx_iz_i & - \frac {1}{n} \sum_ {i=1}^nx_i*{\i} \\ - \frac {1}{n} \sum_ {i=1}^nx_i & 1{\i} \\ \end {array}% \right ) \\ && \hspace {.5cm} \times\left (% \begin {arriba}{c} \frac {1}{n} \sum_ {i=1}}n \epsilon_i \\ \frac {1}{n} \sum_ {i=1}^nx_i*{\i} \epsilon_i \\ \end {array}% \right ) \\ & \to_p & \frac {1}{E(x_iz_i)-E(z_i)E(x_i)} \left (% \begin {\i1}{\b1}{\b1}{\b1}{\b1}{\b1}}Más} {\b1}de la familia.{\b}} E(x_iz_i) & -E(x_i) \\ -E(x_i) & 1 \\ \end {array}% \right ) \times\left (% \begin {\i1}{\b1}{\b1}{\b1}{\b1}Más} {\b1}de la familia.{\b}} E( \epsilon_i ) \\ E(x_i \epsilon_i ) \\ \end {array}% \right ) \\ &=& \frac {1}{Cov(x_i,z_i)} \left (% \begin {\i1}{\b1}{\b1}{\b1}{\b1}{\b1}}Más} {\b1}de la familia.{\b}} E(x_iz_i) & -E(x_i) \\ -E(x_i) & 1 \\ \end {array}% \right ) \times\left (% \begin {\i1}{\b1}{\b1}{\b1}{\b1}Más} {\b1}de la familia.{\b}} E( \epsilon_i ) \\ E(x_i \epsilon_i ) \\ \end {array}% \right ) \\ \end {eqnarray*} En consecuencia, ˆδ1,IV−δ1→p−E(xi)E(ϵi)+E(xiϵi)Cov(xi,zi)=Cov(xi,ϵi)Cov(xi,zi) Por lo tanto, tenemos eso, no es de extrañar, ˆδ1→pδ1 si y sólo si Cov(xi,ϵi)=0 . Ahora, escribe la pantalla anterior como ˆδ1,IV−δ1→pσϵσzCorr(xi,ϵi)Corr(xi,zi) Si la correlación entre x y z es una pequeña, incluso aparentemente insignificante endogeneidad de los instrumentos (en el sentido de Corr(xi,ϵi)≈0 ) puede llevar a una inconsistencia arbitrariamente fuerte del estimador intravenoso.
Por lo tanto, puede ser preferible estimar el modelo con OLS, a pesar de la violación de la presunción de predeterminabilidad . Análogamente a la derivación anterior, se muestra que ˆδ1,OLS−δ1→pσϵσzCorr(zi,ϵi). Por lo tanto, tenemos ˆδ1,OLS−δ1<ˆδ1,IV−δ1 para Corr(zi,ϵi)<Corr(xi,ϵi)/Corr(xi,zi), lo cual es muy posible con instrumentos débiles y endógenos. (En la práctica, esta comparación no se puede hacer desgraciadamente, ya que ϵi es inobservable.)
Este ejemplo no tiene nada que decir sobre LATE, asume un único coeficiente idéntico para todos i .