Estaba tratando de entender cómo ajustado $R^2$ en una regresión lineal simple se comporta cuando existe multicolinealidad. Y me di cuenta de que no podía replicar la $R^2$ proporcionado por el paquete de análisis de datos de Excel, cuando tenía múltiples variables de entrada iguales.
He creado un conjunto de datos como el siguiente:
Excel devuelve el cuadrado R y la tabla ANOVA como se indica a continuación:
Podría replicar el $R^2$ número
$$1 - \frac{SS_{res}}{SS_{tot}}.$$
Sin embargo, para el ajuste $R^2$ Mi cálculo es el siguiente
$$1 - \frac{SS_{res}/(n-k-1)}{SS_{tot}/(n-1)},$$
donde $n$ es el número de observaciones y $k$ es el número de variables, sin incluir el intercepto) da como resultado $1 - \frac{1.983/(9-3-1)}{60/(9-1)} = 0.9471$ que es muy diferente del resultado de Excel (0,6765).
Creo que podría estar utilizando los grados de libertad equivocados aquí, pero no he podido averiguar cuál es el problema exacto.