Esta pregunta se refiere a la diferencia entre la suma de lm.influence(model)$hat
y la traza de la matriz del sombrero $H := X (X' X)^{-1} X'$ calculado "a mano".
Tomemos por ejemplo el coches conjunto de datos y el modelo lineal $dist = \beta \cdot speed + \varepsilon$
data(cars)
mod <- lm(dist ~ speed, cars)
Utilizando lm.influence
para calcular la traza obtengo 2. lm.influence
se supone que devuelve los elementos diagonales de $H$ (ver ?lm.influence
).
sum(lm.influence(mod)$hat)
[1] 2
Calcular la traza de $H$ "a mano" obtengo 1:
X <- cars$speed
H <- X %*% solve(t(X) %*% X) %*% t(X)
sum(diag(H))
[1] 1
Desde mi punto de vista debería ser 1 como el rango de un vector de 1 columna $\equiv$ 1.
Para los modelos lineales, la traza de la matriz del sombrero es igual al rango de X, que es el número de parámetros independientes del modelo lineal. Fuente: http://en.wikipedia.org/wiki/Hat_matrix