¿Cuál es la fórmula exacta utilizada en R lm()
para el R-cuadrado ajustado? ¿Cómo puedo interpretarlo?
Fórmulas de r-cuadrado ajustadas
Parece que existen varias fórmulas para calcular la R-cuadrada ajustada.
- La fórmula de Wherry: $1-(1-R^2)\frac{(n-1)}{(n-v)}$
- La fórmula de McNemar: $1-(1-R^2)\frac{(n-1)}{(n-v-1)}$
- La fórmula del Señor: $1-(1-R^2)\frac{(n+v-1)}{(n-v-1)}$
- La fórmula de Stein: $1-\big[\frac{(n-1)}{(n-k-1)}\frac{(n-2)}{(n-k-2)}\frac{(n+1)}{n}\big](1-R^2)$
Descripciones de los libros de texto
- Según el libro de texto de Field, Descubrir la estadística con R (2012, p. 273) R utiliza la ecuación de Wherry, que "nos dice cuánta varianza en Y se contabilizaría si el modelo se hubiera derivado de la población de la que se tomó la muestra". No da la fórmula de Wherry. Recomienda utilizar la fórmula de Stein (a mano) para comprobar la validez cruzada del modelo.
- Kleiber/Zeileis, Econometría aplicada con R (2008, p. 59) afirman que es la "R-cuadrada ajustada de Theil" y no dicen exactamente cómo varía su interpretación de la R-cuadrada múltiple.
- Dalgaard, Introducción a la estadística con R (2008, p. 113) escribe que "si se multiplica [la R-cuadrada ajustada] por el 100%, puede interpretarse como "% de reducción de la varianza"". No dice a qué fórmula corresponde.
Anteriormente había pensado, y leído mucho, que el R-cuadrado penaliza por añadir variables adicionales al modelo. Ahora, el uso de estas fórmulas diferentes parece exigir diferentes interpretaciones. También miré una pregunta relacionada en Stack Overflow ( ¿Cuál es la diferencia entre R-cuadrado múltiple y R-cuadrado ajustado en una regresión por mínimos cuadrados de una sola variable? ), y el diccionario estadístico de la escuela Wharton en UPenn .
Preguntas
- ¿Qué fórmula se utiliza para el r-cuadrado ajustado por R
lm()
? - ¿Cómo puedo interpretarlo?