1 votos

Transformación inversa

Tengo un modelo de regresión lineal simple, y he realizado transformaciones en la respuesta y en la variable explicativa (véase la llamada en el código de abajo), y he obtenido una r-cuadrado de 0,415. Cuando volví a transformar la variable de respuesta a sus unidades originales, obtuve un r-cuadrado de 0,29. Mis preguntas son dos:

  • En primer lugar, ¿por qué hay tanta diferencia en los valores de r-cuadrado cuando se utiliza el mismo conjunto de datos?
  • En segundo lugar, si informo del error cuadrático medio del segundo modelo (que he leído que es la acción más apropiada), ¿puedo seguir informando del r-cuadrado del primer modelo (es decir, r-cuadrado de 0,42)?

Consulte los dos informes de síntesis que figuran a continuación. Gracias.

1. Call:
lm(formula = sqrt(Clay_Tot) ~ Dose, data = PedonsTx.11.LatLong)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.9745 -0.6534 -0.1394  0.4876  4.5746 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 1.203414   0.248964   4.834 2.42e-06 ***
Dose        0.075897   0.005848  12.977  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.161 on 235 degrees of freedom
Multiple R-squared:  0.4175,    Adjusted R-squared:  0.415 
F-statistic: 168.4 on 1 and 235 DF,  p-value: < 2.2e-16

2. Call:
lm(formula = Clay_Tot ~ Back.Dose.11, data = PedonsTx.11.LatLong)

Residuals:
    Min      1Q  Median      3Q     Max 
-22.316  -6.372  -2.337   2.649  60.211 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  7.8260736  1.4977945   5.225 3.84e-07 ***
Back.Dose.11 0.0070682  0.0007112   9.939  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.75 on 235 degrees of freedom
Multiple R-squared:  0.2959,    Adjusted R-squared:  0.2929 
F-statistic: 98.78 on 1 and 235 DF,  p-value: < 2.2e-16

1voto

AdamSane Puntos 1825

Cuando te transformas, cambias muchas cosas:

1) la cantidad de variación de la respuesta

2) la forma de la relación entre y y x

3) la difusión de la relación

Así que no puede esperar $R^2$ para que sean similares en todas las transformaciones. Una respuesta transformada no es "el mismo conjunto de datos": ¡la transformación cambia las cosas!

enter image description here

Se podría encajar una relación y transformar de nuevo y tratar de comparar los ajustes, pero entonces el $R^2$ no es realmente significativo para la respuesta retrotransformada.

--

Cuando dices "¿puedo...?"; si quieres decir "¿tiene sentido?" - eso depende. ¿Qué está utilizando el $R^2$ para transmitir un modelo diferente? ¿Qué dice al respecto?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X