A lo largo de mi respuesta, la habitual independencia media condicional $\mathbb{E}(\varepsilon_{i}\vert X_{i},Z_{i})=0$ se mantiene.
Es instructivo considerar un caso concreto ejemplo concreto. Sea $X_{i}$ sea una variable ficticia de educación universitaria, tal que $X_{i}=1$ si el trabajador $i$ es un graduado universitario, y $X_{i}=0$ en caso contrario; y que $Z_{i}$ sea una variable ficticia de género, tal que $Z_{i}=1$ si $i$ es masculino, y $0$ si $i$ es femenino. Y supongamos que $Y_{i}$ es la renta observada. Por lo tanto, $\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)$ es el ingreso esperado de un varón con estudios universitarios, y $\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0)$ es la renta esperada de una mujer con estudios universitarios. Otras expectativas expectativas condicionales, como $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0$ ), tienen interpretaciones similares.
En primer lugar, no es difícil comprobar que los coeficientes $\alpha_{2}$ es igual a $$ \alpha_{2}=\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0). $$ Es la diferencia de los ingresos esperados de los hombres y las mujeres universitarios graduados universitarios. La importancia de $\alpha_{2}$ puede ser un indicio de discriminación por razón de sexo entre los graduados universitarios.
A continuación, tenemos $$ \beta_{2}+\beta_{3}=\alpha_{2}=\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0). $$ Y $$ \beta_{0}+\beta_{2}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1),\ \beta_{0}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0). $$ Así que $$ \beta_{2}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0), $$ que mide la discriminación de género entre los trabajadores sin estudios universitarios. Y $\beta_{3}=(\beta_{2}+\beta_{3})-\beta_{2}$ Es decir $$ \beta_{3}=\{\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0)\}-\{\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)\}. $$ Así que $\beta_{3}$ puede entenderse la diferencia de las magnitudes de la discriminación de género en dos cohortes, los trabajadores con universidad la educación y los trabajadores sin título universitario. El signo positivo de $\beta_{3}$ indica que la discriminación por razón de género entre los trabajadores con mayor nivel de formación es mayor que en los trabajadores con menor nivel de formación.
Por último, pero no menos importante, una suposición importante hecha implícitamente por el modelo (1) es la siguiente $$ \mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)=\mathbb{E}(Y_{i}\vert X_{i}=0)=\alpha_{0}. $$ Es decir, al especificar el modelo (1), se ha asumido que no hay discriminación salarial de género para los que no tienen título universitario. La expectativa $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)$ y $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)$ son los ingresos esperados de las trabajadoras y los trabajadores sin estudios educación universitaria, respectivamente. Este supuesto, en general, puede o no no cumplirse, dependiendo de su ejercicio empírico.
2 votos
Una forma de enfocar esto sería reconocer que si se utiliza $1,-1$ codificación de las variables (en lugar de la habitual $1,0$ ), entonces $W_i = X_iZ_i$ también es un $1,-1$ variable binaria y $Z_i = X_iW_i$ que hace del modelo (1) un modelo aditivo estándar para $Y$ en términos de $X$ y $W$ y el modelo (2) es lo mismo con el $X*W$ interacción incluida (con coeficiente $\beta_2$ ). Es de suponer que es un territorio conocido para ti y que te sientes cómodo interpretando los coeficientes. (Si no es así, busca en nuestro sitio: hay muchos hilos sobre la interpretación de las interacciones).