Hay cuatro tipos de personas:
- Never Takers (NT): $D = 0$ para ambos valores de Z
- Defensores (DF): $D=0$ cuando $Z =1$ y $D=1$ cuando $Z =0$
- Cumplidores (C): $D=1$ cuando $Z =1$ y $D=0$ cuando $Z =0$
- Siempre Tomadores (AT): $D =1$ para ambos valores de $Z$ .
La fórmula del estimador de Wald es: $$ \Delta_ {IV} = \frac {E(Y|Z=1)−E(Y|Z=0)}{Pr(D=1|Z =1)−Pr(D=1|Z =0)}$$
Usando nuestros 4 grupos y las reglas básicas de probabilidad, podemos reescribir las dos piezas del numerador como: $$E(Y|Z=1)=E(Y_1 |AT) \cdot Pr(AT)+E(Y_1 |C) \cdot Pr(C)+E(Y_0 |DF) \cdot Pr(DF)+E(Y_0 |NT) \cdot Pr(NT)$$ y $$E(Y|Z=0)=E(Y_1 |AT) \cdot Pr(AT)+E(Y_0 |C) \cdot Pr(C)+E(Y_1 |DF) \cdot Pr(DF)+E(Y_0 |NT) \cdot Pr(NT) $$
Los dos términos denominadores son: $$ Pr(D=1|Z =1)=Pr(D=1|Z =1,AT) \cdot Pr(AT)+Pr(D=1|Z =1,C) \cdot Pr(C) \\ =Pr(AT)+Pr(C) $$ y $$ Pr(D=1|Z =0)=Pr(D=1|Z = 0,AT) \cdot Pr(AT)+Pr(D=1|Z =0,DF) \cdot Pr(DF) \\ =Pr(AT)+Pr(DF)$$
La primera de ellas corresponde a su primera expresión.
Volviendo a la fórmula de Wald y enchufando estos, vemos que algunos de estos términos se cancelan en la resta, dejando $$ \Delta_ {IV} = \frac {[E(Y_1 |C) \cdot Pr(C)+E(Y_0 |D) \cdot Pr(D)]−[E(Y_0 |C) \cdot Pr(C)+E(Y_1 |DF) \cdot Pr(DF)]}{Pr(C) − Pr(DF)}.$$ This da una idea. El estimador Wald IV es un promedio ponderado del efecto del tratamiento sobre los complacientes y el negativo del efecto del tratamiento sobre los complacientes.
Ahora hacemos dos suposiciones. Primero, asumimos la monotonicidad, de modo que el instrumento sólo puede aumentar o disminuir la probabilidad de participación. Esto significa que $Pr(DF) = 0$ . La hipótesis de monotonicidad equivale a suponer un modelo de función de índice para el tratamiento. La segunda suposición es que hay algunos complicadores, es decir que $Pr(C) > 0$ . El comportamiento de algunos individuos debe ser alterado por el instrumento. Este debería ser el caso si el instrumento es relevante. Estos dos supuestos producen
$$ \Delta_ {IV} = \frac {E(Y_1 |C) \cdot Pr(C)−E(Y_0 |C) \cdot Pr(C)}{Pr(C)}=E(Y_1 |C)−E(Y_0 |C)=LATE.$$