Supongamos que tengo dos arreglos unidimensionales, $a_1$ y $a_2$. Cada uno contiene 100 puntos de datos. $a_1$ son los datos reales y $a_2$ es la predicción del modelo. En este caso, el valor de $R^2$ sería: $$ R^2 = 1 - \frac{SS_{res}}{SS_{tot}} \quad\quad\quad\quad\quad\ \ \quad\quad(1). $$ Mientras tanto, esto sería igual al cuadrado del coeficiente de correlación, $$ R^2 = (\text{Coeficiente de Correlación})^2 \quad (2). $$ Ahora, si intercambio los dos: $a_2$ son los datos reales y $a_1$ es la predicción del modelo. Según la ecuación $(2)$, ya que el coeficiente de correlación no se preocupa por el orden, el valor de $R^2$ sería el mismo. Sin embargo, según la ecuación $(1)$, $SS_{tot}=\sum_i(y_i - \bar y )^2$, el valor de $R^2$ cambiará, porque el $SS_{tot}$ ha cambiado si cambiamos $y$ de $a_1$ a $a_2$; mientras tanto, $SS_{res}=\sum_i(y_i -f_i)^2$ no cambia.
Mi pregunta es: ¿Cómo pueden contradecirse entre sí?
Editar:
-
Me preguntaba si la relación en la Ec. (2) seguirá siendo cierta si no es una regresión lineal simple, es decir, si la relación entre IV y DV no es lineal (podría ser exponencial / logarítmica)?
-
¿Seguirá siendo cierta esta relación si la suma de los errores de predicción no es igual a cero?
0 votos
Encontré esta presentación muy útil y no técnica: google.com/…