La conclusión meramente cuenta las dimensiones de los espacios vectoriales. Sin embargo, no es cierto en general.
La mayoría de las propiedades básicas de la multiplicación de la matriz muestran que la transformación lineal representada por la matriz $\mathbb{H}=X(X^\prime X)^{-}X^\prime$ satisface
$$\mathbb{H}^2 = \left(X(X^\prime X)^{-}X^\prime\right)^2=X(X^\prime X)^{-}(X^\prime X)(X^\prime X)^{-}X^\prime=\mathbb{H},$$
exhibe como una proyección del operador. Por lo tanto, su complemento
$$\mathbb{Q} = 1 - \mathbb{H}$$
(como se da en la pregunta) también es una proyección del operador. La traza de $\mathbb{H}$ es su rango $h$ (ver más abajo), donde la traza de $\mathbb{Q}$ es igual a $n-h$.
A partir de su fórmula es evidente que $\mathbb{H}$ es la matriz asociada a la composición de dos transformaciones lineales $$\mathbb{J}=(X^\prime X)^{-}X^\prime$$ and $X$ itself. The first ($\mathbb{J}$) transforms the $n$-vector $y$ into the $p$-vector $\hat\beta$. The second ($X$) is a transformation from $\mathbb{R}^p$ to $\mathbb{R}^n$ given by $\sombrero y = X\hat \beta$. Its rank cannot exceed the smaller of those two dimensions, which in a least squares setting is always $p$ (but could be less than $p$, whenever $\mathbb{J}$ is not of full rank). Consequently the rank of the composition $\mathbb{H}=X\mathbb{J}$ cannot exceed the rank of $X$. La conclusión, entonces, es
$\text{tr} (\mathbb{Q}) = n-p$ si y sólo si $\mathbb{J}$ es de rango completo; y, en general,$n \ge \text{tr} (\mathbb{Q}) \ge n-p$. En el primer caso el modelo se dice que es "identificable" (para los coeficientes de $\beta$).
$\mathbb{J}$ va a ser de rango completo si y sólo si $X^\prime X$ es invertible.
Interpretación geométrica
$\mathbb{H}$ representa la proyección ortogonal de a $n$-vectores $y$ (que representa a la "respuesta" o "variable dependiente") en el espacio generado por las columnas de a $X$ (que representa a las "variables independientes" o "variables de control"). La diferencia $\mathbb{Q}=1-\mathbb{H}$ muestra cómo descomponer cualquier $n$-vector $y$ en una suma de vectores $$y = \mathbb{H}(y) + \mathbb{Q}(y),$$ where the first can be "predicted" from $X$ and the second is perpendicular to it. When the $p$ columns of $X$ generate a $p$-dimensional space (that is, are not collinear), the rank of $\mathbb{H}$ is $p$ and the rank of $\mathbb{Q}$ is $n p$, reflecting the $n-p$ dimensiones adicionales de la variación en la respuesta que no están representadas dentro de las variables independientes. La traza se da una fórmula calculada para estas dimensiones.
Álgebra Lineal Fondo
Un operador de proyección en un espacio vectorial $V$ (como $\mathbb{R}^n$) es una transformación lineal $\mathbb{P}:V\to V$ (es decir, un endomorfismo de $V$) tal que $\mathbb{P}^2=\mathbb{P}$. Esto hace que su complementar $\mathbb{Q}=1-\mathbb{P}$ un operador de proyección, también, porque
$$\mathbb{Q}^2 = \left(1 - \mathbb{P}\right)^2 = 1 - 2\mathbb{P} + \mathbb{P}^2 = 1-2\mathbb{P}+\mathbb{P} = \mathbb{Q}.$$
Todas las proyecciones de la revisión de cada elemento de sus imágenes, para siempre $v\in \text{Im}(\mathbb{P})$ podemos escribir $v = \mathbb{P}(w)$ algunos $w\in V$, de donde $$w = \mathbb{P}(v) = \mathbb{P}^2(v) = \mathbb{P}(\mathbb{P}(v)) = \mathbb{P}(w).$$
Asociados con cualquier endomorfismo $\mathbb{P}$ $V$ son dos subespacios: su núcleo $$\text{ker}(\mathbb{P}) = \{v\in v\,|\, \mathbb{P}(v)=0\}$$ and its image $$\text{Im}(\mathbb{P}) = \{v\in v\,|\, \exists_{w\in V} \mathbb{P}(w)=v\}.$$ Every vector $v\V$ can be written in the form $$v = w+u$$ where $w\ \ en \text{Im}(\mathbb{P})$ and $u\en \text{Ker}(\mathbb{P})$. We may therefore construct a basis $E \copa F$ for $V$ for which $E \subconjunto \text{Ker}(\mathbb{P})$ and $F \subconjunto \text{Im}(\mathbb{P})$. When $V$ is finite-dimensional, the matrix of $\mathbb{P}$ in this basis will therefore be in block-diagonal form, with one block (corresponding to the action of $\mathbb{P}$ on $E$) all zeros and the other (corresponding to the action of $\mathbb{P}$ on $F$) equal to the $f$ by $f$ identity matrix, where the dimension of $F$ is $f$. The trace of $\mathbb{P}$ is the sum of the values on the diagonal and therefore must equal $f\veces 1 = f$. This number is the rank of $\mathbb{P}$: la dimensión de su imagen.
La traza de $1-\mathbb{P}$ es igual a la traza de $1$ (igual a $n$, la dimensión de la $V$) menos la traza de $\mathbb{P}$.
Estos resultados pueden resumirse en la afirmación de que la traza de una proyección es igual a su rango.