Si ejecuto un modelo de regresión logística en R...por ejemplo
summary(glm(data, formula = dichotomous.outcome.variable ~ age + hpv,family = binomial(link = "logit")))
Obtengo un resultado como el siguiente
Null deviance: 142.18 on 417 degrees of freedom
Residual deviance: 112.42 on 415 degrees of freedom
(1 observation deleted due to missingness)
AIC: 118.42
Number of Fisher Scoring iterations: 9
¿Tiene algún valor considerar (142,18-112,42)/142,18 = 0,21?
Se podría decir: "El intercepto representa el modelo de referencia, en el que simplemente predice para cada caso la probabilidad de referencia". Así que si el 5% fuera VERDADERO, entonces simplemente predice una probabilidad del 5% para cada caso. O dicho de otro modo, dado que sólo el 5% fuera VERDADERO, el modelo de referencia podría predecir que todos los casos fueran FALSOS y sólo se equivocaría en el 5% de los casos". Ahora venimos con nuestro mejor modelo. ¿Podemos decir: "Nuestro modelo explica el 21% de la variabilidad"? ¿Tiene mucho valor, poco valor o valor cero (o quizá incluso un valor peligrosamente contradictorio) fijarse en la reducción porcentual de la desviación nula?
Por favor, desautoríceme de cualquier idea errónea que pueda albergar.