El problema general :
Tengo dos modelos alternativos que podría utilizar para mi estimación
Modelo A: $y = \alpha^A+ X \beta^A_0 + Z\beta^A_1 + \varepsilon^A$
Modelo B: $y = \alpha^B + X \beta^B_0 + \varepsilon^B$
$X$ : $(n\times k_X)$ y
${Z}$ : $(n\times k_{Z})$
Quiero estimar el efecto de X sobre y, pero puedo utilizar opcionalmente un conjunto de variables ( $Z$ ) como variables de control.
Estoy tratando de evaluar la diferencia que supone para mi estimación de la pendiente si la estimo a través del modelo A o del modelo B. En concreto, quiero encontrar una expresión analítica para evaluarla:
- La covarianza entre $\hat{\beta_0^A}$ y $\hat{\beta_0^B}$
- La expectativa condicional: E[ $\hat{\beta_0^A}$ | $\hat{\beta_0^B}$ ]
- O, idealmente, las distribuciones conjuntas completas / relación funcional entre los dos estimadores
Un problema simplificado con solución :
Ya encontré una solución para el caso más sencillo con $k_X=1$ y $k_{Z}=1$ pasando de la notación matricial a la notación de suma:
Estimación del coeficiente de la pendiente OLS del modelo B (sin variables de control): $$\beta^{B}_0 = \frac{\sum_ix_iy_i}{\sum_ix_i^2}$$ Estimación del coeficiente de la pendiente OLS del modelo A (con un control): $$\beta^A_0 = \frac{(\sum_ix_iy_i)(\sum_iz_i^2)-(\sum_iy_iz_i)(\sum_iz_ix_i)}{(\sum_ix_i^2)(\sum_iz_i^2)-(\sum_ix_iz_i)^2}$$ donde las letras minúsculas indican desviaciones de la media, por ejemplo $x_i = X_i-\bar{X}$ .
Reordenando los términos se obtiene: $$\beta^A_0\left(1-\frac{(\sum_ix_iz_i)^2}{\sum_ix_i^2\sum_iz_i^2}\right) + \frac{\sum_iy_iz_i\sum_iz_ix_i}{\sum_ix_i^2\sum_iz_i^2}= \beta^B_0 $$
Esto es lo que quiero generalizar al caso general.
Editar: en la versión original de la pregunta pedía el caso de que los dos modelos tuvieran dos conjuntos alternativos de covariables.
0 votos
Si es útil, la recompensa también se concederá a las respuestas semicompletas
0 votos
Cambié (simplifiqué) la pregunta. Estoy convencido de que la respuesta a la pregunta original se deduce inmediatamente de la respuesta a esta versión simplificada.... Así que esto debería ser suficiente.
2 votos
Creo que mi antigua respuesta de Statalist también debería responder a su pregunta. Dime si crees que lo hace, y escribiré las matemáticas para ti.
0 votos
@tchakravarty sí, parece que podría responder a mi pregunta. Sin embargo ten en cuenta que estoy preguntando por el caso general con Z no siendo un vector, sino conteniendo posiblemente más de una variable. Dado que tu comentario fue anterior a la primera respuesta de abajo me gustaría ver tu respuesta y considerar este orden a la hora de adjudicar la recompensa