Supongamos que tengo un conjunto de datos en el que cada fila representa un sujeto de prueba. Hay una variable dependiente ( y
) y dos columnas binarias ( x1
, x2
).
y
x1
x2
10
0
0
12
0
1
9
1
0
13
1
1
Hay cuatro grupos de personas (4 combinaciones posibles de x1 y x2). Quiero calcular el efecto medio del tratamiento de $x_1$ para cada tipo de $x_2$ . Es decir:
$$d_1 = E(Y|x_1=1, x_2=0) - E(Y|x_1=0, x_2=0)$$ $$d_2 = E(Y|x_1=1, x_2=1) - E(Y|x_1=0, x_2=1)$$
¿Cómo se compara este enfoque con el siguiente modelo de regresión? $$Y_i = \beta_0 + \beta_1 x_{1i} + \beta_{2i} x_2 + \beta_3 x_{1i} x_{2i} + \varepsilon_i$$
¿Es cierto que $d_1 = \hat{\beta}_1$ y $d_2 = \hat{\beta}_1 + \hat{\beta}_3$ ?
Lo pregunto porque he probado ambos enfoques y las igualdades no se mantienen por un margen relativamente grande.