5 votos

Interpretación GLM de los parámetros de las variables predictoras ordinales

Cuando se utiliza el glm en la función stats paquete con variables ordinales

data$X1 <- ordered(data$X1)
data$X2 <- ordered(data$X2)
data$X3 <- ordered(data$X3)
data$X4 <- ordered(data$X4)
data$X5 <- ordered(data$X5)
data$X6 <- ordered(data$X6)

glm(Y ~ X1 + X2 + X3 + X4 + X5 + X6, data = data)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.19445    0.07169  30.610  < 2e-16 ***
X1.L         0.48235    0.10060   4.795 2.48e-06 ***
X1.Q        -0.42570    0.08366  -5.089 6.11e-07 ***
X1.C        -0.01543    0.07109  -0.217  0.82832    
X1^4        -0.06392    0.05936  -1.077  0.28230    
X2.L         0.51696    0.26341   1.963  0.05055 .  
X2.Q        -0.34153    0.19369  -1.763  0.07879 .  
X2.C         0.28979    0.13800   2.100  0.03651 *  
X2^4        -0.30389    0.10082  -3.014  0.00278 ** 
X3.L        -0.01790    0.10756  -0.166  0.86790    
X3.Q         0.17086    0.08730   1.957  0.05119 .  
X3.C         0.04131    0.07452   0.554  0.57975    
X3^4         0.08683    0.06149   1.412  0.15891    
X4.L         0.18349    0.27466   0.668  0.50457    
X4.Q         0.32422    0.20563   1.577  0.11583    
X4.C        -0.39733    0.14880  -2.670  0.00796 ** 
X4^4         0.29617    0.10123   2.926  0.00368 ** 
X5.L         0.29977    0.10860   2.760  0.00610 ** 
X5.Q        -0.35389    0.08825  -4.010 7.53e-05 ***
X5.C         0.03904    0.07258   0.538  0.59102    
X5^4        -0.02931    0.05908  -0.496  0.62011    
X6.L         0.16479    0.18020   0.915  0.36113    
X6.Q        -0.14659    0.15071  -0.973  0.33146    
X6.C         0.05724    0.11289   0.507  0.61245    
X6^4        -0.09772    0.07570  -1.291  0.19764
---
...

Entiendo las variables con .L , .Q y .C y ^4 son, respectivamente, los coeficientes del factor ordenado codificado con contrastes lineales, cuadráticos, cúbicos y cuárticos.

Algunas de las variables son significativas ( *** , ** , * ) pero no son lineales (por ejemplo: X2 ). Mi pregunta es, cuando se informa del resultado de qué variable es estadísticamente significativa en la predicción de Y, y si estas variables tienen pesos positivos o no, ¿qué coeficiente se debe utilizar? Estos predictores ( X1 , X2 , X4 , X5 ) tienen coeficientes significativos en sus formas lineales, cuadráticas, cúbicas, etc., pero en direcciones opuestas.

¿Es válido decir que X2 es estadísticamente significativa para predecir Y y tiene una correlación positiva?

¿Puede alguien indicarme algo que me ayude a entender cómo informar de los resultados de glm ¿análisis con factores ordenados?

5voto

Ben Bolker Puntos 8729

Estoy usando un ejemplo ligeramente cocinado aquí.

data("kyphosis",package="HH")
kk <- subset(kyphosis,Number<=5 & Start>=13 & Start<=17)
kk <- transform(kk, Number=ordered(Number), Start=ordered(Start),
                kyph=as.numeric(Kyphosis)-1)

Desgraciadamente, como he recortado tanto el conjunto de datos, sólo hay 2 casos de cifosis presnt (de 43 casos), por lo que tengo que utilizar el brglm paquete para superar la separación completa

library(brglm)
m1 <- brglm(Kyphosis~Number+Start,family=binomial,data=kk)

## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -2.038967   0.581733  -3.505 0.000457 ***
## Number.L     0.221716   1.321268   0.168 0.866736    
## Number.Q     0.074500   1.286798   0.058 0.953832    
## Number.C     0.359261   1.227672   0.293 0.769801    
## Start.L     -0.813621   1.627716  -0.500 0.617178    
## Start.Q      0.295470   1.584274   0.187 0.852051    
## Start.C      1.231051   1.259250   0.978 0.328269    
## Start^4      0.007603   1.430817   0.005 0.995760    

La prueba:

 m2 <- update(m1, . ~ . - Number)
 anova(m1,m2,test="Chisq")

Esto comprueba si Number tiene un efecto significativo en general sobre la incidencia de la cifosis. Determinar si Number significativamente aumenta la incidencia de la cifosis es complicada, porque los contrastes de nivel superior/no lineal (cuadrático/Q, cúbico/C, cuártico/4, etc.) hacen que el efecto de aumentar Number por 1 unidad puede depender de dónde empiece. Por ejemplo, si el término cuadrático es grande y (digamos, sin mucha pérdida de generalidad) positivo, entonces el efecto de aumentar Number será generalmente para disminuir la incidencia cuando Number es pequeño y aumentarlo cuando Number es grande. Supongo que si el término lineal es positivo y significativo y todos los demás términos son pequeños, entonces se podría decir que hay un efecto positivo de Number en la cifosis, pero por lo demás será difícil de decir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X