Pregunta:
Encuentre el estimador GLS $\hat{\beta}$ para el modelo lineal
$$Y=\beta X+\epsilon$$ donde $\mathbb{E}\epsilon=0$ y $\text{Cov}(\epsilon)=\sigma^2\Sigma$ , donde $\Sigma$ es positiva definida.
Según la Wikipedia, la respuesta correcta es $$\hat{\beta}=(X^T\Sigma^{-1}X)^{-1}X^T\Sigma^{-1}Y,$$ pero ¿qué hay de malo en esta derivación?
Establecer $B=Y-X\beta$ entonces queremos minimizar $f(B)=B^T\Sigma^{-1}B$ . Ahora $\nabla f=2\Sigma^{-1}B$ (Me saltaré el trabajo aquí, pero puedo insertarlo si esto puede ser la fuente de error), así que tenemos $$\nabla f=0\iff B=0\iff Y=X\beta\iff X^TY=(X^TX)\beta\iff \beta=(X^TX)^{-1}X^TY$$
Esto no parece correcto, ya que es una simplificación importante del resultado anterior (es sólo el estimador OLS). ¿Dónde me he equivocado?
Nota: Si no cancelo el $\Sigma^{-1}$ en $\Sigma^{-1}B=0$ y realizar el mismo trabajo obtengo la respuesta correcta, pero no veo por qué no puedo anular esto.