7 votos

Significado de los valores p de una interacción entre una variable categórica (w/ >2 gatos) y una variable continua

Tengo una pregunta sobre el significado de los valores p cuando se prueba una interacción entre una variable continua y una categórica (con más de 2 categorías).

Cuando hago eso en un modelo glm usando R, obtengo un valor p para cada clase de la variable categórica vs. la continua. Sin embargo, me gustaría obtener el valor p de la interacción misma usando R, y entender cuál es el significado de este valor p.

Un ejemplo del código y los resultados:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ** 

Me gustaría tener el valor p de la interacción y su significado (es decir, sólo un valor p para toda la interacción, no uno para cada categoría)

9voto

Eero Puntos 1612

La forma general de hacerlo es con una prueba de modelo reducido completo utilizando el anova función. Reajuste su modelo sin la interacción de interés (la update puede ser conveniente para esto) y luego ejecutar la función anova en los modelos completo y reducido, para un glm probablemente querrá incluir test="Chisq" .

Algo así como:

model_glm3_reduced <- update( model_glm3, .~. - lg_hag:as.factor(educa) )
anova( model_glm3_reduced, model_glm3, test="Chisq" )

En este caso, la hipótesis nula es que los 2 modelos se ajustan igual de bien (cualquier diferencia se debe al azar) y la alternativa es que el modelo completo contiene al menos un término que mejora el ajuste. Dado que la diferencia en los 2 modelos es sólo el término de interacción, se obtiene una única prueba (valor p) para comprobar la interacción completa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X