Consideremos el siguiente modelo lineal \begin{equation} Y_{j}=\beta_{1}+\beta_{2}E_{j}+\beta_{3}B_{j}+\epsilon_{j} \tag{*} \end{equation} donde $Y_{j}$ representa el logaritmo natural del salario anual de un empleado en la actualidad, $E_{j}$ el número de años terminados en una institución educativa, y $B_{j}$ es el logaritmo natural del salario inicial del trabajador.
He retrocedido $(*)$ en un gran conjunto de datos, y comparó los coeficientes $\beta_{2}, \beta_{3}$ a otro modelo que incluye dos variables ficticias adicionales, $D_{1j}$ (género) y $D_{2j}$ (minoría). Aunque no han cambiado drásticamente, todavía hay algún cambio. Ahora bien, no tengo ningún problema en dar una explicación cualitativa de por qué esto es así. Lo que busco es lo siguiente:
¿Existe algún cálculo, quizás una prueba, que facilite una explicación cualitativa de por qué los coeficientes de $(*)$ puede cambiar cuando se añaden dos variables ficticias?