1 votos

Lectura del modelo resumen de una regresión logística glm en R

Estoy aprendiendo a hacer regresión logística y tengo algunas preguntas sobre la verificación del modelo basado en la salida en R. En primer lugar a continuación se pueden ver los resultados del análisis AIC que eligió el modelo con sólo Almacenamiento como el predictor para ser el más adecuado. enter image description here

A continuación tenemos el resumen de este modelo candidato.

enter image description here

Así que mi pregunta es, estoy mirando el valor p para el intercepto y parece que no es significativo. ¿Es importante que el intercepto sea significativo dado que a menudo no tiene ningún significado en el contexto del problema? Es decir, ¿es este modelo invalidado por la insignificante y-intercepto? Además, como se trata de una regresión logística, creo haber leído vagamente que estos valores p no se utilizan realmente en la regresión logística. Entonces, ¿qué pasa con el escenario en el que una regresión lineal simple tiene una intersección y insignificante? ¿Es importante?

Fíjese también en la desviación residual. Es sobre dispersiva creo, en 5.173> 4 df. Ahora, ¿qué debo hacer? ¿Ignorar el modelo, aunque AIC dijo que este es el mejor?

Lo siguiente es anova

enter image description here

¿Hay algo que deba extraer de esta lectura? Muchas gracias.

3voto

James Puntos 21

P -valores en GLMs

Utilizando p -para los MLG no es un problema en sí, siempre que se cumplan los supuestos del modelo. Sin embargo, primero ha seleccionado el "mejor" modelo basándose en el AICc, por lo que el p -valor de Storage en el modelo resultante ha perdido su significado (usted ya eligió este modelo basándose en la significación de este predictor, por lo que el p -valor está sesgado). Sería mejor que informara del p -valor de Storage en el modelo original, incluyendo todos los demás predictores. De hecho, si su objetivo es informar sobre la significación/tamaño del efecto de estos predictores, entonces no hay necesidad de seleccionar el modelo, ya que podría hacerlo con su modelo completo.

: Y como con cualquier prueba de significación, tenga en cuenta que siempre es mejor incluir los tamaños del efecto en lugar de informar p -valores solos.

Significado del intercepto

Esto sólo le indica si la parte lineal del MLG cruza el eje y significativamente lejos de y=0 . A menos que sea importante para su investigación, puede ignorar esta prueba por completo. Desde luego, no invalida en absoluto su modelo.

: O más correctamente, η=0 la parte lineal del MLG.

Sobredispersión

Es bueno que tenga en cuenta el tamaño de la desviación residual ( 5.173 ) en comparación con la f.d. residual ( 4 ) Sin embargo, yo diría que en realidad están bastante próximos entre sí y el χ2 -El estadístico de sobredispersión sería muy bajo. Como regla general, considere si estas dos cifras están más o menos en el mismo orden de magnitud. Si una es el doble o la decena de veces mayor que la otra, su p -son más fiables utilizando una distribución cuasi-binomial.


Importancia en general

Y lo que es más importante, creo que deberías centrarte menos en la importancia. La significación del intercepto no es importante, la insignificancia no es motivo para seleccionar el modelo y la significación de los predictores por sí misma no es muy significativa, para empezar.

Recomiendo echar un vistazo a algunas de las preguntas y respuestas sobre la regresión por pasos (selección de variables en función de la significación) y por qué es casi siempre una mala idea. Un buen punto de partida es aquí y aquí . Puede que en algún curso le hayan enseñado a seleccionar predictores significativos, pero esto es no una buena idea. Para que te hagas una idea, aquí tienes una cita del segundo post enlazado:

[Todos los predictores de un modelo y su supuesta relación causal entre una única exposición de interés y un único resultado de interés deben especificarse a priori. [...] Algunas revistas (y la tendencia se está imponiendo) rechazará sumariamente cualquier artículo que utilice la regresión por pasos para identificar un modelo final (Babyak, 2004), y creo que el problema se ve de forma similar aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X