7 votos

Interpretación del modelo saturado frente al modelo con interacción y un efecto principal

Digamos que tengo dos regresiones:

1) $Y_i = \alpha_0 + \alpha_1 X_i + \alpha_2 X_i*Z_i + \epsilon_i$

2) $Y_i = \beta_0 + \beta_1 X_i + \beta_2 Z_i + \beta_3 X_i*Z_i + \epsilon_i$

$X_i$ y $Z_i$ son ambas variables binarias. $Y_i$ es continua.

¿En qué difieren las interpretaciones de los coeficientes estimados entre 1) y 2)? En concreto, ¿cómo debo interpretar $\alpha_2$ y $\beta_3$ ?

2 votos

Una forma de enfocar esto sería reconocer que si se utiliza $1,-1$ codificación de las variables (en lugar de la habitual $1,0$ ), entonces $W_i = X_iZ_i$ también es un $1,-1$ variable binaria y $Z_i = X_iW_i$ que hace del modelo (1) un modelo aditivo estándar para $Y$ en términos de $X$ y $W$ y el modelo (2) es lo mismo con el $X*W$ interacción incluida (con coeficiente $\beta_2$ ). Es de suponer que es un territorio conocido para ti y que te sientes cómodo interpretando los coeficientes. (Si no es así, busca en nuestro sitio: hay muchos hilos sobre la interpretación de las interacciones).

5voto

Oliver M Grech Puntos 161

A lo largo de mi respuesta, la habitual independencia media condicional $\mathbb{E}(\varepsilon_{i}\vert X_{i},Z_{i})=0$ se mantiene.

Es instructivo considerar un caso concreto ejemplo concreto. Sea $X_{i}$ sea una variable ficticia de educación universitaria, tal que $X_{i}=1$ si el trabajador $i$ es un graduado universitario, y $X_{i}=0$ en caso contrario; y que $Z_{i}$ sea una variable ficticia de género, tal que $Z_{i}=1$ si $i$ es masculino, y $0$ si $i$ es femenino. Y supongamos que $Y_{i}$ es la renta observada. Por lo tanto, $\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)$ es el ingreso esperado de un varón con estudios universitarios, y $\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0)$ es la renta esperada de una mujer con estudios universitarios. Otras expectativas expectativas condicionales, como $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0$ ), tienen interpretaciones similares.

En primer lugar, no es difícil comprobar que los coeficientes $\alpha_{2}$ es igual a $$ \alpha_{2}=\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0). $$ Es la diferencia de los ingresos esperados de los hombres y las mujeres universitarios graduados universitarios. La importancia de $\alpha_{2}$ puede ser un indicio de discriminación por razón de sexo entre los graduados universitarios.

A continuación, tenemos $$ \beta_{2}+\beta_{3}=\alpha_{2}=\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0). $$ Y $$ \beta_{0}+\beta_{2}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1),\ \beta_{0}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0). $$ Así que $$ \beta_{2}=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0), $$ que mide la discriminación de género entre los trabajadores sin estudios universitarios. Y $\beta_{3}=(\beta_{2}+\beta_{3})-\beta_{2}$ Es decir $$ \beta_{3}=\{\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=1,Z_{i}=0)\}-\{\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)-\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)\}. $$ Así que $\beta_{3}$ puede entenderse la diferencia de las magnitudes de la discriminación de género en dos cohortes, los trabajadores con universidad la educación y los trabajadores sin título universitario. El signo positivo de $\beta_{3}$ indica que la discriminación por razón de género entre los trabajadores con mayor nivel de formación es mayor que en los trabajadores con menor nivel de formación.

Por último, pero no menos importante, una suposición importante hecha implícitamente por el modelo (1) es la siguiente $$ \mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)=\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)=\mathbb{E}(Y_{i}\vert X_{i}=0)=\alpha_{0}. $$ Es decir, al especificar el modelo (1), se ha asumido que no hay discriminación salarial de género para los que no tienen título universitario. La expectativa $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=0)$ y $\mathbb{E}(Y_{i}\vert X_{i}=0,Z_{i}=1)$ son los ingresos esperados de las trabajadoras y los trabajadores sin estudios educación universitaria, respectivamente. Este supuesto, en general, puede o no no cumplirse, dependiendo de su ejercicio empírico.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X