5 votos

Regresión lineal coeficiente de incremento del significado

Tengo ejecutar una serie de modelos de regresión lineal. En el modelo 1, he añadido tres covariables. El modelo 2 es el mismo que el modelo 1 con un extra de covariable (de educación) que se agrega a examinar el efecto de la educación en el coeficiente de la variable de resultado.

Al comparar el modelo 1 modelo 2, si el coeficiente para la variable de resultado disminuye a partir del modelo 1 modelo 2 puedo decir que la educación adicional variable he añadido en el modelo 2 se ha atenuado la variable de resultado. Yo entiendo eso.

Sin embargo, en algunos casos, el coeficiente para la variable de resultado aumentos del modelo 1 modelo 2 - ¿cómo debo interpretar esto (no es la atenuación de la variable de resultado, se ha reforzado el coeficiente, pero ¿qué significa eso?). He puesto un ejemplo a continuación.

Ejemplo

Grupo 1 - modelo 1 coefficent = 4.70. Modelo 2 coeficiente = 4.23 en el modelo 2 (es decir, una disminución de modelo 1)

Grupo 1 - modelo 1 coefficent = 4.16. Modelo 2 coeficiente = 5.32 en el modelo 2 (es decir, un aumento de modelo 1)

2voto

Yuval Sp Puntos 316

Usted podría tener un moderador en sus manos. Ver este blog en busca de información. Para entender mejor lo que esto significa, pensar de esta segunda variable como enmascarar algunas de la relación real entre el original coeficiente y su variable de respuesta. Vamos a intentar un ejemplo sencillo:

Supongamos que tenemos un simple conjunto de datos de datos tratando de explicar la felicidad (suponer un índice de 0 a 100) mediante la medición de la cantidad de amigos y país de origen (0=Japón, 1=China).

moderator <- data.frame(friends=c(3,3,4,5,7,7,7,8,9,9), happy = c(20,30,50,35,70,20,40,50,50,70), country = c(0,0,0,0,0,1,1,1,1,1))
moderator$country <- factor(moderator$country, levels = c(0,1), labels = c("Japan", "China"))

Ahora vamos a ajustar un modelo con sólo amigos y con los amigos y el país:

Call:
lm(formula = happy ~ friends, data = moderator)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)   15.105     14.697   1.028   0.3341  
friends        4.580      2.236   2.048   0.0747 .

Y

Call:
lm(formula = happy ~ friends + country, data = moderator)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)   -9.079     13.541  -0.670  0.52406   
friends       11.382      2.861   3.978  0.00534 **
country      -35.974     12.484  -2.881  0.02360 * 

Aquí también se puede ver que el coeficiente de amigos se ha incrementado de manera significativa después de controlar para el país. Esto hace sentido teórico para llamar a un país moderador. Pero esto no está muy claro todavía. así que vamos a hacer algo que a menudo se pasa por alto - permite la trama (el uso de la ggplot2 paquete):

p.1 <- ggplot(moderator, aes(x = friends, y = happy)) + 
    geom_point(size = 5) + geom_smooth(method=lm, se = FALSE)

p.2 <- ggplot(moderator, aes(x = friends, y = happy, colour = country)) + 
    geom_point(size = 5) + geom_smooth(method=lm, se = FALSE) + 
    theme(legend.position = c(.2, .2))
grid.arrange(p.1, p.2, ncol=2)

scatter plots of the two models

Es más claro ahora lo que sucedió. El original coeficiente fue de pequeño, porque un segundo factor - país, fue la moderadora de la relación. Cuando pensamos en ella, el coeficiente se hizo más grande.

1voto

En general, existen varias correlaciones para pensar. Supongamos que el modelo es

$$ y = x_1 \beta + x_2 \gamma + c + u$$

No puede haber una correlación entre el $x_1$ $x_2$ $c$ (por ejemplo supongamos que $c$ es una variable omitida como de la capacidad).

Ignorando $c$: Si $x_1,x_2$ están correlacionados positivamente y ambas están correlacionadas con el término de error $u$ y con la posibilidad de $c$, entonces sabemos que la inclusión de $x_2$, en comparación con sólo la regresión $y$ $x_1$ va a conducir a una estimación a la baja de $\beta$, porque antes, $x_1$ fue "chupando" parte de la variación que debería haber sido atribuido a $x_2$. Sin embargo, si los dos están negativamente correlacionados, de lo contrario va a ser el caso: esto es debido a que aquellos con mayor $x_1$ también tienen menor $x_2$, por lo que el efecto neto en $y$ podría ser cero (si $\beta,\gamma$ son positivos).

Si $c$ está presente y se correlacionó Si ambos están correlacionados con $c$, entonces es una cuestión de que el signo de esta relación y que es más fuerte.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X