En el análisis econométrico de Wooldridge de datos de corte transversal y de panel, define la proyección lineal de $y$ en $1, \mathbf {x}$ de la siguiente manera:
Asumamos que $Var( \mathbf {x})$ es positiva-definida, entonces la proyección lineal de $y$ en $ \mathbf {x}$ existe y es único de tal manera que
$L(y|1, \mathbf {x})= \beta_0 + \mathbf {x} \beta $ donde por definición
$ \beta =(Var( \mathbf {x}))^{-1}Cov( \mathbf {x},y)$ y $ \beta_0 =E(y)-E( \mathbf {x}) \beta $ .
Primero no veo cómo el autor llega a esa definición, y cómo se relaciona con ésta en el artículo de Wikipedia sobre Proyección . Normalmente tenemos $P=X(X'X)^{-1}X'$ donde $X$ es la matriz con columnas $1, \text {and } \mathbf {x}$ para la muestra (aunque no estoy seguro de cómo escribir esta proyección con la población). En segundo lugar, en lugar de definir las betas como arriba, ¿no podríamos haber deducido esas ecuaciones? ¿Cómo?
Cualquier ayuda sería apreciada.
Edición: Según el libro, la notación es la siguiente. $ \mathbf {x}$ es un vector de dimensiones en fila $K$ así que la dimensión de la matriz de diseño es $N \times K$