11 votos

Informar los resultados de la regresión lineal simple: ¿Qué información incluir?

Yo sólo han realizado algunos (muy) de regresión lineal simple en Genstat y quisiera incluir una breve y significativa resumen de la salida en mi informe. No estoy seguro exactamente qué o cuánto de la información que debe ser incluida.

El principal pedacitos de mi Genstat salida de este aspecto:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Yo tenía la intención de este informe simplemente como:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

pero un colega me sugirió que debería también incluir al menos el root mean squared error (que creo que en este caso es igual al error estándar de las observaciones, es decir, el 99,9?).

¿Incluyendo el RMSE proporcionar información útil adicional, o es la bondad de ajuste ya explicado adecuadamente por la ajustada valor de R2?

Hay rígidas reglas de la cantidad de información a reportar, o es bastante subjetivo?

Muchas gracias!

7voto

patfla Puntos 1

Para una regresión lineal simple, yo siempre iba a producir una parcela de la variable x en contra de la y variable, con la línea de regresión super-impuesto sobre la trama (siempre revise sus datos siempre que sea factible!). Esto le dirá a usted muy fácilmente lo bien que el modelo se ajusta bien, y es fácil de leer para 1 variable de regresión. Agregando que, para lo que ya tienes probablemente sería suficiente, aunque puede que desee incluir algunos gráficos de diagnóstico (apalancamiento, cocineros distancia, residuos, etc.). Depende de cómo de buena es que x-y parcela, y en su público objetivo, y todos los protocolos que su público espera.

$R^2$ vs RMSE

$R^2$ es una medida relativa, mientras que el RMSE es más de una medida absoluta, como era de esperar la mayoría de las observaciones a ser dentro de $\pm$RMSE de los armarios de la línea, y casi todos a ser dentro de $\pm 2$RMSE. Si desea transmitir "poder explicativo" $R^2$ es probablemente mejor, y si quieren transmitir "poder predictivo", el RMSE es probablemente mejor.

1voto

mtruesdell Puntos 1639

Uso para informar el coeficiente β y el IC del 95%, el valor de p y Rsquared ajustado. Ej.:

(Β = 1,46, IC del 95% [1.19, 1.8], p = 0,001 **, ajustado R2 = 0.48)

Si reportando una regresión múltiple o una regresión con variables de factor, denuncio el coeficiente, el IC del 95%, los valores de p y luego por separado las estadísticas de F (grados de libertad), el R2 ajustado y el valor de p del modelo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X