Una cuestión importante es que la medida de la "variación" en el análisis de regresión está relacionada con la al cuadrado diferencias de las variables observadas con respecto a sus valores medios previstos. Se trata de una elección útil de una medida de variación, tanto para el análisis teórico como en el trabajo práctico, porque las diferencias al cuadrado con respecto a la media están relacionadas con la varianza de una variable aleatoria, y la varianza de la suma de dos variables aleatorias independientes es simplemente la suma de sus varianzas individuales.
$R^2$ en regresión múltiple representa la fracción de "variación" en la variable observada que es explicada por el modelo de regresión cuando al cuadrado como medida de variación. La R múltiple es simplemente la raíz cuadrada de $R^2$ .
Me temo que nunca he entendido la utilidad de especificar el valor de la R múltiple en lugar de $R^2$ . A diferencia del coeficiente de correlación $r$ en una regresión univariante, que muestra tanto la dirección como la fuerza de la relación entre 2 variables, especificar la R múltiple no parece añadir mucho más allá de una posibilidad de confusión adicional.
6 votos
Uno de mis mejores profesores contó la defensa de su tesis doctoral en la que explicó a un grupo de oceanógrafos físicos que su regresión podía explicar el XX% de la variación de unos datos. Un distinguido examinador se levantó y proclamó: "Con sus correlaciones no ha explicado usted exactamente nada; más bien nos ha ofrecido una sugerencia que fracasa el 10% de las veces".
3 votos
Esto es un duplicado de: stats.stackexchange.com/questions/90793/