10 votos

La interpretación de los coeficientes de una interacción entre categóricas y continuas de variable

Tengo una pregunta acerca de la interpretación de los coeficientes de la interacción entre el continuo y variable categórica. aquí está mi modelo:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

digamos que la ecuación del modelo es:

E[cog] = a + b1(lg_hag) + b2(educa2*lg_hag) + b3(educa3*lg_hag) + b4(educa4*lg_hag) + b5(pdg, centrado) + otros covars, donde

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Mi pregunta es: si mi interpretación es correcta, la forma de construir los intervalos de confianza para cada uno de los efectos de la estimación de las interacciones (e.g: b1+b2) a partir de los intervalos de confianza de b1 y b2.

Gracias muy uch por sus respuestas

Youssef

9voto

Sven Hohenstein Puntos 3188

Su interpretación de los coeficientes del modelo no es completamente exacta. Permítanme en primer lugar un resumen de los términos de la modelo.

Categorial de las variables (factores): $race$, $sex$, y $educa$

El factor de race tiene cuatro niveles: $race = \{white, black, mexican, multi/other\}$.

El factor de sextiene dos niveles: $sex = \{male, female\}$.

El factor de educa tiene cinco niveles: $educa = \{1, 2, 3, 4, 5\}$.

De forma predeterminada, R utiliza el tratamiento de contrastes para las variables categóricas. En estos contrastes, el primer valor de este factor se utilizó un nivel de referencia y el resto de los valores son a prueba en contra de la referencia. El número máximo de contrastes para una variable categórica es igual al número de niveles menos uno.

Los contrastes de la race permitir la realización de pruebas las siguientes diferencias: $race = black\ vs. race = white$, $race = mexican\ vs. race = white$, y $race = multi/other\ vs. race = white$.

Para el factor de $educa$, el nivel de referencia es $1$, el patrón de contrastes es análogo. Estos efectos pueden ser interpretados como la diferencia en la variable dependiente. En tu ejemplo, el valor de la media de cog es $13.8266$ unidades más para $educa = 2$ en comparación con $educa = 1$ (as.factor(educa)2).

Una nota importante: Si el tratamiento contrastes para una variable categórica están presentes en un modelo, la estimación de los efectos se basa en el nivel de referencia de la variable categórica si las interacciones entre los efectos y la variable categórica se incluyen también. Si la variable no es parte de una interacción, su coeficiente corresponde a la media de la el individuo laderas de los subconjuntos de esta varible a lo largo de todo el resto de las variables categóricas. Los efectos de la $race$ $educa$ corresponden a la media de los efectos con respecto a los niveles de los factores de las otras variables. Para probar los efectos globales de $race$, tendría que dejar a $educa$ $sex$ fuera de la modelo.

Las variables numéricas: $lg\_hag$ $pdg$

Ambos lg_hag y pdg son variables numéricas por tanto, los coeficientes representan el cambio en la variable dependiente asociada con un aumento de $1$ en el predictor.

En principio, la interpretación de estos efectos es sencillo. Pero tenga en cuenta que si interations están presentes, la estimación de los coeficientes se basa en las referencias de las categorías de los factores (si el tratamiento contrastes son empleados). Desde $pdg$ no es parte de una interacción, su coeficiente de corrsespods a la pendiente promedio de la variable con respecto a la lavels de las variables categóricas. La variable $lg\_hag$ es también parte de una interacción con $educa$. Por lo tanto, su efecto se mantiene por $educa = 1$, el nivel de base.; esta no es una prueba de la influencia de la variable numérica $lg\_hag$, independientemente de los niveles de los factores.

Las interacciones entre categóricos y numéricos de las variables: $lg\_hag \times educa$

El modelo no sólo incluyen los efectos principales, pero también de las interacciones entre la variable numérica $lg\_hag$ y los cuatro contrastes asociados con $educa$. Estos efectos pueden ser interpretados como la diferencia en las laderas de $lg\_hag$ entre un cierto nivel de $educa$ y el nivel de referencia ($educa = 1$).

Por ejemplo, el coeficiente de lg_hag:as.factor(educa)2 (-21.2224) significa que la pendiente de $lg\_hag$ $21.2224$ unidades inferiores para $educa = 2$ en comparación con $educa = 1$.

9voto

boomean Puntos 11

no muy familiarizado con la forma de hacer que en R. supongamos que en el sas se puede obtener el resultado de la declaración de "estimar", se refieren a http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_glm_sect013.htm

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X