2 votos

Explicación cuantitativa de los cambios provocados por las variables ficticias

Consideremos el siguiente modelo lineal \begin{equation} Y_{j}=\beta_{1}+\beta_{2}E_{j}+\beta_{3}B_{j}+\epsilon_{j} \tag{*} \end{equation} donde $Y_{j}$ representa el logaritmo natural del salario anual de un empleado en la actualidad, $E_{j}$ el número de años terminados en una institución educativa, y $B_{j}$ es el logaritmo natural del salario inicial del trabajador.

He retrocedido $(*)$ en un gran conjunto de datos, y comparó los coeficientes $\beta_{2}, \beta_{3}$ a otro modelo que incluye dos variables ficticias adicionales, $D_{1j}$ (género) y $D_{2j}$ (minoría). Aunque no han cambiado drásticamente, todavía hay algún cambio. Ahora bien, no tengo ningún problema en dar una explicación cualitativa de por qué esto es así. Lo que busco es lo siguiente:

¿Existe algún cálculo, quizás una prueba, que facilite una explicación cualitativa de por qué los coeficientes de $(*)$ puede cambiar cuando se añaden dos variables ficticias?

4voto

Sean Hanley Puntos 2428

No estoy seguro de entender su pregunta. Veo dos posibilidades:

  1. Puedes prueba para ver si la relación (es decir, si $\beta_2$ y $\beta_3$ cambio) entre el salario y la educación y el salario inicial difieren según el género y la condición de minoría, incluyendo y probando los términos de interacción. A continuación se analizan las interacciones: Interacción en el modelo lineal generalizado . El modelo que encajaría es:
    \begin{align} Y_{j} = &\beta_{1} + \beta_{2}E_{j} + \beta_{3}B_{j} + \beta_4D_{1j} + \beta_5D_{2j} + \\ &\beta_6E_{j}D_{1j} + \beta_7E_{j}D_{2j} + \beta_8B_{j}D_{1j} + \beta_9B_{j}D_{2j} + \varepsilon_{j} \end{align} Las pruebas de los términos de interacción son las pruebas de $\beta_6$ , $\beta_7$ , $\beta_8$ y $\beta_9$ . En cuanto a qué prueba utilizar, deduzco que tus dummies son variables únicas (1 df), así que si quieres probarlas individualmente, puedes utilizar el $t$ -pruebas de los coeficientes que vienen con la salida típica de la regresión. (Por el contrario, si el estatus de minoría fuera múltiples dummies para comparar varias minorías cada una con la mayoría étnica/racial, entonces tendría que eliminarlas todas y probar el modelo anidado con un $F$ -prueba). Si desea probar si una variable ficticia (por ejemplo, el género), tiene un impacto en el efecto de la educación o el salario inicial juntos, tendría que eliminar ambos términos de interacción y utilizar el $F$ -prueba para el modelo anidado. Explico el uso del $F$ -prueba para múltiples dummies en una interacción aquí: Pruebas de moderación con moderadores continuos y categóricos .

  2. Si se pregunta por qué los efectos que ya están en su modelo (es decir $\beta_2$ y $\beta_3$ ) podría haber cambiado al añadir las variables ficticias, la respuesta es la endogeneidad. Es decir, sus variables estaban correlacionadas con sus variables ficticias. Para saber más sobre esto, puede ayudarte leer mi respuesta aquí: ¿Cuál es la diferencia entre "controlar" e "ignorar" otras variables en la regresión múltiple?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X