1 votos

Variables ficticias en regresión (problema de cálculo de MCO)

Supongamos que tengo el siguiente modelo:

$Y = \alpha_0 + \alpha_1E_1 +\alpha_2E_2$, donde $E_1$ indica el primer grupo ($1,2..n_1$) de individuos, y $E_2$ indica el segundo grupo ($n_1,n_1 + 1,...n$)

Quiero encontrar OLS de los coeficientes. Pero las columnas en mi matriz X no son independientes (porque la primera columna consiste en unos y las segunda y tercera columnas son dependientes de la primera columna)

$(X^tX) = $$ \left( \begin{array}{ccc} n & n_1 & n_2 \\ n_1 & n_1 & 0 \\ n_2 & 0 & n_2 \end{array} \right)$

Y como las columnas no son independientes, la inversa no existe.

La pregunta es: ¿cómo puedo encontrar OLS en esta situación? ¿Son correctos mis argumentos?

Editar: Creo que podemos probar los coeficientes por separado (si consideramos el primer grupo, la regresión se ve así: $Y = \alpha_0 + \alpha_1E_1$ y podemos calcular los coeficientes sin problemas. ¿Es esa la forma correcta de resolver el problema?

3voto

SulimanF Puntos 6

Por lo general, cuando tienes una variable categórica con $k$ niveles, insertas $k-1$ variables dummy en tu modelo de regresión, para garantizar el rango completo de la matriz de diseño para poder calcular las estimaciones de OLS.

Ese es tu caso, tienes 2 grupos, insertas una variable dummy $E_1$, cuando esta es $0$ es claro que el individuo pertenece al otro grupo.

Entonces el modelo que escribiste en la edición es el adecuado para ambos grupos:

si un individuo $i$ pertenece al primer grupo estás modelando

$E[Y_i] = \alpha_0 + \alpha_1*1 $

si pertenece al segundo

$E[Y_i] = \alpha_0 $

$E[Y_i]$ indica valor esperado

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X