5 votos

la regresión que se hace R2 sólo se aplican para medir la regresión lineal de rendimiento?

De fondo

Según la Wiki: https://en.wikipedia.org/wiki/Coefficient_of_determination, $R^2$ es el coeficiente de determinante. La definición es $$ R^2 = 1 - \dfrac{ESS}{SST} $$

Desde $SSE$ es simplemente la suma de cuadrados de los residuos, no hace daño a utilizarse para la regresión no lineal. Y he visto un montón de gente haciendo así, aunque la versión ajustada puede ser difícil de justificar en la regresión no lineal de caso.

Donde las diferentes voces

Así que el truco solo cosa es que, por regresión no lineal en general,
$$ SST \neq SSR + SSE $$ así que se puede decir así, el coeficiente de determinación podría ser fuera de la cota de [0,1]. Por tanto no se definitino. Sin embargo, yo diría que hace ajustado $R^2$ en la regresión lineal realmente garantiza la boundness?

De modo que la parte clave que asegura la por encima de la igualdad de la varianza es que uno podría necesitar los siguientes $$\sum_{i}(y_i - \hat{y}_i) (\hat{y}_i - \overline{y})^\top = 0$$, donde $y$-ish sigue la regresión lineal de estilo por lo que es un vector fila. Puede ser descompuesto en dos partes $$ \sum_i (y_i - \hat{y}_i) \hat{y}_i = 0 $$ $$ \sum_i (y_i - \hat{y}_i) \overline{y} = 0 $$ El segundo es siempre true si $\hat{y} = \alpha + g(x;\beta)$, donde $g$ es una función parametrizada por $\beta$. Entonces cualquier punto a lo largo de $\alpha$ podría satisfacer a la segunda.

La primera es un poco complicado.

Sin embargo, su significado es muy simple: simplemente han de error residual no en el sentido lineal con la predicción sobre la formación de distribución. Cuidado de los lectores podría darse cuenta de que echo de menos una expectativa, sin embargo, recuerde que el segundo se mantiene, por lo que naturalmente absorbe.

Esto tiene sentido para algunos casos. Imagínese si residual se correlaciona con la predicción en el sentido lineal, entonces significa que todavía hay espacio para la mejora de un proceso más complejo, no lineal del modelo. En efecto, véase la ecuación 21 de el Dios de la SI: Billings del papel. En ese sentido, un bien entrenados no lineales del modelo debe ser aproximadamente tiene el $$SST \approx SSR + SSE$$

Otra de las voces

Hay algún trabajo de investigación que muestran que sólo mirando a $R^2$ para modelos no lineales no siempre vamos a elegir el mejor modelo, que sin duda es aceptable. Depende de lo que creo que es cierto y no creo a menos que, por comparación obvia, a menudo es difícil discernir dos modelos que se realiza de manera similar. Personalmente, yo también tengo algunas experiencias que encontrar en modelos no lineales $R^2$ alrededor de 0.90 no me va a dar muy buenos resultados debido a que los datos desequilibrio. Por lo que utilizar otros indicadores para determinar la diferencia de forma conjunta.

Pregunta:

¿Tiene sentido? Puede $R^2$ se utiliza para la regresión no lineal? Mi preferencia es que sí lo podemos usar, pero con cautela, y que mejor que tener el diagrama de dispersión

-1voto

Devon Parsons Puntos 206

En mi experiencia, $R^{2}$ no es adecuado para evaluar la no-modelos de regresión lineal.

El hecho de que $SST \neq SSR + SSE$ puede provocar una serie de problemas, algunos de los cuales ya se han señalado y están contenidas en el documento de la investigación que se hace referencia.

Mientras yo estaba trabajando en mi tesis, yo también traté de evaluar la regresión no lineal de los modelos de uso de $R^{2}$. Esto resultó en que muchos profundamente los valores negativos. Inicialmente, yo atribuí esto a mis modelos están mal especificada. Sin embargo, incluso me las arreglé para mejorar algunos de los modelos (de acuerdo con algunas otras métricas) $R^{2}$ el valor no lo indican. Por lo tanto, no podía confiar en $R^{2}$ a distinguir los modelos que funcionan bien desde que eran horribles. El papel que hace referencia va más allá de afirmar que no siempre escoger el modelo adecuado, se pasa a estado usted pueda elegir el modelo equivocado más a menudo que no.

Para responder a su pregunta: "¿Podemos?". Por supuesto, usted puede utilizar, muchos paquetes estadísticos se permiten calcular con facilidad. Sin embargo, creo que no va a ser muy útil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X