1 votos

Comparación de la desviación residual con la desviación nula en un modelo de regresión logística: ¿Es falaz la reducción porcentual?

Si ejecuto un modelo de regresión logística en R...por ejemplo

summary(glm(data, formula = dichotomous.outcome.variable ~ age + hpv,family = binomial(link = "logit")))

Obtengo un resultado como el siguiente

Null deviance: 142.18  on 417  degrees of freedom  
Residual deviance: 112.42  on 415  degrees of freedom
(1 observation deleted due to missingness)
AIC: 118.42
Number of Fisher Scoring iterations: 9

¿Tiene algún valor considerar (142,18-112,42)/142,18 = 0,21?

Se podría decir: "El intercepto representa el modelo de referencia, en el que simplemente predice para cada caso la probabilidad de referencia". Así que si el 5% fuera VERDADERO, entonces simplemente predice una probabilidad del 5% para cada caso. O dicho de otro modo, dado que sólo el 5% fuera VERDADERO, el modelo de referencia podría predecir que todos los casos fueran FALSOS y sólo se equivocaría en el 5% de los casos". Ahora venimos con nuestro mejor modelo. ¿Podemos decir: "Nuestro modelo explica el 21% de la variabilidad"? ¿Tiene mucho valor, poco valor o valor cero (o quizá incluso un valor peligrosamente contradictorio) fijarse en la reducción porcentual de la desviación nula?

Por favor, desautoríceme de cualquier idea errónea que pueda albergar.

1voto

Isabella Ghement Puntos 9964

El modelo de sólo intercepción tiene este aspecto en R:

m0 <- glm(dichotomous.outcome.variable ~ 1,family = binomial(link = "logit")), data = data) 

y estipula que la probabilidad de éxito (donde éxito significa que la variable.resultado.dicotómica = 1) es constante; en concreto, no depende de ninguna de sus variables predictoras medidas.

El modelo que incluye los predictores de edad y VPH tiene el siguiente aspecto:

m1 <- glm(dichotomous.outcome.variable ~ age + hpv,family = binomial(link = "logit")), data = data) 

y estipula que la probabilidad de éxito depende tanto de la edad como del VPH (por ejemplo, la probabilidad de éxito puede aumentar con la edad pero disminuir con el VPH).

Cuando se comparan los dos modelos, básicamente se ponen a prueba dos hipótesis contrapuestas:

Ho: probability of success is constant
Ha: probability of success depends on both age and hpv 

Si Ho es cierto, la edad y el VPH de un sujeto no influyen en su probabilidad de éxito. Si Ha es cierta, la probabilidad de éxito de un sujeto estaría influida por su edad y su VPH (por ejemplo, un sujeto de edad avanzada con un valor bajo de VPH tendría una probabilidad de éxito alta), aunque la influencia de la edad en esta probabilidad es independiente del VPH y viceversa.

Una forma de probar estas hipótesis mutuamente excluyentes es examinar la reducción de la desviación nula conseguida al introducir los predictores de edad y VPH en el predictor de sólo intercepto. Si la reducción es (estadísticamente) significativa, los datos proporcionan pruebas en contra de la hipótesis nula de la probabilidad constante de éxito y a favor de la hipótesis alternativa de la probabilidad no constante de éxito que depende de la edad y del VPH.

Por lo tanto, no basta con calcular la reducción de la desviación nula, sino que también hay que determinar si esta reducción es estadísticamente significativa. Véase Interpretación de la desviación residual y nula en GLM R para saber cómo hacerlo. Alternativamente, compare los dos modelos anteriores con la función anova:

anova(m0, m1, test = "Chisq") 

El artículo de PLoS One ¿Valores p no significativos? Estrategias para comprender y determinar mejor la importancia de los efectos y las interacciones en la regresión logística de Vakhitova et al. (doi:10.1371/journal.pone.0205076) le ofrecerá una visión más completa de la cuestión tratada en mi respuesta: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6261058/ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X