13 votos

La investigación de la robustez de la regresión logística en contra de la violación de la linealidad de logit

Estoy llevando a cabo una regresión logística con un resultado binario (de inicio y no se inicia). Mi mezcla de los predictores son, ya sea continua o variables dicotómicas.

El uso de la Caja-Tidwell enfoque, uno de mis continuos predictores potencialmente viola la suposición de linealidad de la logit. No hay ninguna indicación de bondad de ajuste de las estadísticas que el ajuste es problemático.

He posteriormente ejecutar el modelo de regresión de nuevo, sustituyendo el original de la variable continua con: en primer lugar, una transformación de raíz cuadrada y en segundo lugar, una versión dicotómica de la variable.

En la inspección de la salida, parece que la bondad de ajuste de mejora ligeramente, pero los residuos de ser problemática. Las estimaciones de parámetros, errores estándar e $\exp(\beta)$ permanecen relativamente similares. La interpretación de los datos no cambia en términos de mi hipótesis, a través de los 3 modelos.

Por lo tanto, en términos de la utilidad de los resultados de mi y el sentido de la interpretación de los datos, parece oportuno informe en el modelo de regresión con el original de variable continua.

Estoy preguntando esto:

  1. Cuando es la regresión logística robusta contra de la posible infracción de la linealidad de logit suposición?
  2. Dada mi ejemplo de arriba, ¿no le parece aceptable incluir la original de la variable continua en el modelo?
  3. Hay referencias o guías que hay para recomendar cuando es satisfactorio para aceptar que el modelo es robusto frente a la potencial violación de la linealidad de la logit?

19voto

dan90266 Puntos 609

La linealidad de la asunción es tan común violado en regresión, que debería ser llamada una sorpresa más que una suposición. Como otros modelos de regresión, el modelo logístico es no robusto a la no linealidad cuando se asumen erróneamente linealidad. En lugar de detectar la no linealidad utilizando residuos u omnibus de la bondad de ajuste de las pruebas, es mejor utilizar pruebas directas. Por ejemplo, expanda continua predictores utilizando la regresión spline y hacer un ensayo compuesta de todos los términos no lineales. Mejor aún, no prueba los términos y simplemente esperar que la no linealidad. Este enfoque es mucho mejor que tratar diferentes de una sola pendiente opciones de transformaciones tales como la raíz cuadrada, registro, etc., debido a la inferencia estadística surgir después de estos análisis será incorrecta porque no tiene lo suficientemente grande como numerador el número de grados de libertad.

He aquí un ejemplo en R.

require(rms)
f <- lrm(y ~ rcs(age,4) + rcs(blood.pressure,5) + sex + rcs(height,4))
# Fits restricted cubic splines in 3 variables with default knots
# 4, 5, 4 knots = 2, 3, 2 nonlinear terms
Function(f)   # display algebraic form of fit
anova(f)      # obtain individual + combined linearity tests

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X