Cómo puedo demostrar que lo siguiente es cierto, utilizando las propiedades de las covarianzas.
Nos interesa saber cómo una variable binaria de tratamiento $D_i$ afecta a una variable de resultado $Y_i$ . Tenemos acceso a \emph {dos instrumentos binarios válidos} para $D_i$ , $Z_{1i}$ y $Z_{2i}$ . Supongamos que los instrumentos son mutuamente excluyentes, lo que significa que $Cov(Z_{1i},Z_{2i})=0$ .
Suponemos que los efectos del tratamiento son heterogéneos entre los individuos $i$ es decir, que
$${ Y_i = \alpha + \beta_i D_i + \varepsilon_i, }$$
lo que significa que los estimados del IV cuando sólo se utiliza uno de los dos $Z_{1i}$ o $Z_{2i}$ ya que el instrumento no suele ser el mismo.
Dejemos que ${ \beta_1 = \frac{Cov(Y_i,Z_{1i})}{Cov(D_i,Z_{1i})} }$ denotan el estimador IV cuando sólo se utiliza $Z_{1i}$ como instrumento, y definir $\beta_2$ de manera similar cuando sólo se utiliza $Z_{2i}$ como instrumento.
Supongamos que utilizamos $Z_{1i}$ y $Z_{2i}$ para instrumentar para $D_{i}$ . Entonces la ecuación de la primera etapa (de la población) viene dada por
$${ D_i = \pi_0 + \pi_1 Z_{1i} + \pi_2 Z_{2i} + v_{i}. }$$
Denotemos los valores ajustados (de la población) de esta ecuación de la primera etapa por $\tilde{D}_i = \pi_0 + \pi_1 Z_{1i} + \pi_2 Z_{2i}$ . Demuestre que el estimador 2SLS es igual a una media ponderada de los dos estimadores IV $\beta_1$ y $\beta_2$ :
$${ \beta_{2SLS} = \frac{Cov(Y_i,\tilde{D}_i)}{Cov(D_i,\tilde{D}_i)} = \psi \beta_1 + (1-\psi) \beta_2, }$$
donde $\psi = \frac{\pi_1 Cov(D_i,Z_{1i})}{\pi_1 Cov(D_i,Z_{1i}) + \pi_2 Cov(D_i,Z_{2i})}$ .