1 votos

Interpretación de la regresión múltiple

Tengo 3 variables: Mínimo de hierba, Temp. mínima y HR. Grass Min. es mi variable dependiente y necesito ver cómo afectan las otras 2 variables. Los cálculos se hacen en diferentes áreas.

Área 1: Hierba vs. Min

  Call:
lm(formula = Grass ~ Min)

Residuals:
     Min       1Q   Median       3Q      Max 
-10.5775  -0.5576   0.0636   0.6097   2.3573 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.513311   0.024164  -104.0   <2e-16 ***
Min          1.014186   0.001618   626.8   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.9356 on 10626 degrees of freedom
  (297 observations deleted due to missingness)
Multiple R-squared:  0.9737,    Adjusted R-squared:  0.9737 
F-statistic: 3.929e+05 on 1 and 10626 DF,  p-value: < 2.2e-16

La forma de interpretar esto para ver la correlación es mirando el R^2 y el valor p, ¿verdad?

Hierba vs RH:

> model<-lm(Grass~RH08)
> summary(model)

Call:
lm(formula = Grass ~ RH08)

Residuals:
     Min       1Q   Median       3Q      Max 
-16.1283  -4.5832  -0.3155   4.8717  14.9746 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 14.779244   0.242547   60.93   <2e-16 ***
RH08        -0.050708   0.003679  -13.78   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.713 on 10594 degrees of freedom
  (329 observations deleted due to missingness)
Multiple R-squared:  0.01762,   Adjusted R-squared:  0.01753 
F-statistic:   190 on 1 and 10594 DF,  p-value: < 2.2e-16

Aquí podemos ver que nuestro R^2 es bastante bajo, pero el valor p es bastante significativo lo que lleva a que sí afecta a la Grass Min?

Y para Grass ~ Min + RH:

> model<-lm(Grass~Min+RH08)
> summary(model)

Call:
lm(formula = Grass ~ Min + RH08)

Residuals:
     Min       1Q   Median       3Q      Max 
-10.5820  -0.5576   0.0645   0.6083   2.3624 

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.5448234  0.0485845 -52.379   <2e-16 ***
Min          1.0143442  0.0016367 619.752   <2e-16 ***
RH08         0.0004483  0.0006083   0.737    0.461    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.9359 on 10593 degrees of freedom
  (329 observations deleted due to missingness)
Multiple R-squared:  0.9736,    Adjusted R-squared:  0.9736 
F-statistic: 1.956e+05 on 2 and 10593 DF,  p-value: < 2.2e-16

En la última comparación con ambas variables independientes, podemos ver que nuestro R^2 es alto, pero el valor p para RH no es significativo. Mi pregunta es, ¿cómo resultado de estos datos sobre cómo RH y Min.T afecta a la Grass Min?

0voto

Creo que para la variable Min las cosas están bastante claras ¿no? Fuertemente correlacionada positivamente, buena para predecir la hierba, etc.

Entiendo que es escéptico por lo que ocurre en RH08 entre el segundo y el tercer modelo.

Demos un paso atrás. Si nos fijamos en los coeficientes, en el segundo modelo, el RH08 es significativamente distinto de cero con una tendencia a la correlación negativa, mientras que en el último modelo, se convierte en cero con un poco de sabor positivo en él. Además, el tercer modelo es prácticamente idéntico al primero.

Así, vemos que el pequeño porcentaje de variabilidad que explicaba el RH08 en el segundo modelo disminuía aún más al añadir Min. Probablemente Min y RH08 están correlacionados (negativamente) con un R cuadrado muy pequeño y es por eso que después de añadir Min el RH08 se vuelve insignificante. Se puede validar fácilmente mirando su correlación.

Dicho esto, en mi opinión, siempre hay que tener en cuenta la naturaleza de las variables para aplicar un modelo. Sin este conocimiento, lo que me parece más plausible es que la naturaleza de la significación de RH08 en el segundo modelo se debe a que está ligeramente correlacionada con la hierba min indicando un posible factor de confusión (puede ser Min o una variable diferente)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X