Dado un modelo:
$$ y = \beta_0 + \beta_1 \cdot f + u $$
Donde $f$ es ficticio $=1$ si es mujer y $0$ lo contrario, y es la altura en cm. El tamaño de la muestra es $n_{female}=n_{male}=100 \rightarrow 200$ en total. Más $\bar{y}_{male} = 175$$\bar{y}_{female}=165$. Calcular las estimaciones de los parámetros.
Mi intento:
Mediante la conocida fórmula:
$$ \boldsymbol{\hat{\beta}} = (\boldsymbol{X}'\boldsymbol{X})^{-1} \boldsymbol{X}'\boldsymbol{y} $$ Obtengo: $$ \begin{bmatrix} 200 & 100 \\ 100 & 100 \\ \end{bmatrix} ^{-1} \begin{bmatrix} 170 \cdot 200 \\ 165 \cdot 200 \end{bmatrix} $$
Primero los elementos en $(\boldsymbol{X}'\boldsymbol{X})^{-1}$, ya que el $X$ es sólo un montón de los que uno es, hay 100 mujeres en la muestra y hay 200 hombres y mujeres en total. Para $\boldsymbol{X}'\boldsymbol{y}$, el primer elemento es el "grand significa" de 170, y el segundo, es el de la media de la muestra de la altura de las hembras. Ambos son escaladas por los 200, ya que yo no "escala" $(\boldsymbol{X}'\boldsymbol{X})^{-1}$.
Es la correcta? Me pregunto, porque la solución (cuando se multiplica) resultados en algunos (muy) de los números impares.