2 votos

R cuadrado ajustado para múltiples variables de entrada exactamente iguales

Estaba tratando de entender cómo ajustado $R^2$ en una regresión lineal simple se comporta cuando existe multicolinealidad. Y me di cuenta de que no podía replicar la $R^2$ proporcionado por el paquete de análisis de datos de Excel, cuando tenía múltiples variables de entrada iguales.

He creado un conjunto de datos como el siguiente:

data

Excel devuelve el cuadrado R y la tabla ANOVA como se indica a continuación: summary

Podría replicar el $R^2$ número

$$1 - \frac{SS_{res}}{SS_{tot}}.$$

Sin embargo, para el ajuste $R^2$ Mi cálculo es el siguiente

$$1 - \frac{SS_{res}/(n-k-1)}{SS_{tot}/(n-1)},$$

donde $n$ es el número de observaciones y $k$ es el número de variables, sin incluir el intercepto) da como resultado $1 - \frac{1.983/(9-3-1)}{60/(9-1)} = 0.9471$ que es muy diferente del resultado de Excel (0,6765).

Creo que podría estar utilizando los grados de libertad equivocados aquí, pero no he podido averiguar cuál es el problema exacto.

1voto

Ribbitt Puntos 11

Ese R-cuadrado ajustado de Excel (0,6765) es erróneo y es el resultado de que Excel no puede manejar esta situación de multicolinealidad perfecta. Si mira la tabla de coeficientes, verá que las estadísticas t son incorrectas para dos de los $X$ variables que se eliminaron del modelo.

La R cuadrada ajustada correcta es 0,962222 y difiere de su resultado porque $k$ debe ser igual al número de regresores restantes en el modelo. Por lo tanto, en lugar de $k$ siendo igual a 3, debería ser 1 en tu fórmula.

Este resultado se confirma al ejecutar la misma regresión en R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X