De fondo
Según la Wiki: https://en.wikipedia.org/wiki/Coefficient_of_determination, $R^2$ es el coeficiente de determinante. La definición es $$ R^2 = 1 - \dfrac{ESS}{SST} $$
Desde $SSE$ es simplemente la suma de cuadrados de los residuos, no hace daño a utilizarse para la regresión no lineal. Y he visto un montón de gente haciendo así, aunque la versión ajustada puede ser difícil de justificar en la regresión no lineal de caso.
Donde las diferentes voces
Así que el truco solo cosa es que, por regresión no lineal en general,
$$
SST \neq SSR + SSE
$$
así que se puede decir así, el coeficiente de determinación podría ser fuera de la cota de [0,1]. Por tanto no se definitino. Sin embargo, yo diría que hace ajustado $R^2$ en la regresión lineal realmente garantiza la boundness?
De modo que la parte clave que asegura la por encima de la igualdad de la varianza es que uno podría necesitar los siguientes $$\sum_{i}(y_i - \hat{y}_i) (\hat{y}_i - \overline{y})^\top = 0$$, donde $y$-ish sigue la regresión lineal de estilo por lo que es un vector fila. Puede ser descompuesto en dos partes $$ \sum_i (y_i - \hat{y}_i) \hat{y}_i = 0 $$ $$ \sum_i (y_i - \hat{y}_i) \overline{y} = 0 $$ El segundo es siempre true si $\hat{y} = \alpha + g(x;\beta)$, donde $g$ es una función parametrizada por $\beta$. Entonces cualquier punto a lo largo de $\alpha$ podría satisfacer a la segunda.
La primera es un poco complicado.
Sin embargo, su significado es muy simple: simplemente han de error residual no en el sentido lineal con la predicción sobre la formación de distribución. Cuidado de los lectores podría darse cuenta de que echo de menos una expectativa, sin embargo, recuerde que el segundo se mantiene, por lo que naturalmente absorbe.
Esto tiene sentido para algunos casos. Imagínese si residual se correlaciona con la predicción en el sentido lineal, entonces significa que todavía hay espacio para la mejora de un proceso más complejo, no lineal del modelo. En efecto, véase la ecuación 21 de el Dios de la SI: Billings del papel. En ese sentido, un bien entrenados no lineales del modelo debe ser aproximadamente tiene el $$SST \approx SSR + SSE$$
Otra de las voces
Hay algún trabajo de investigación que muestran que sólo mirando a $R^2$ para modelos no lineales no siempre vamos a elegir el mejor modelo, que sin duda es aceptable. Depende de lo que creo que es cierto y no creo a menos que, por comparación obvia, a menudo es difícil discernir dos modelos que se realiza de manera similar. Personalmente, yo también tengo algunas experiencias que encontrar en modelos no lineales $R^2$ alrededor de 0.90 no me va a dar muy buenos resultados debido a que los datos desequilibrio. Por lo que utilizar otros indicadores para determinar la diferencia de forma conjunta.
Pregunta:
¿Tiene sentido? Puede $R^2$ se utiliza para la regresión no lineal? Mi preferencia es que sí lo podemos usar, pero con cautela, y que mejor que tener el diagrama de dispersión