12 votos

Regresión logística y punto de inflexión

Tenemos datos con un resultado binario y algunas covariables. He utilizado la regresión logística para modelar los datos. Es un análisis sencillo, nada extraordinario. El resultado final se supone que es una curva dosis-respuesta donde mostramos cómo cambia la probabilidad para una covariable específica. Algo así:

enter image description here

Recibimos algunas críticas de un revisor interno (no un estadístico puro) por haber elegido la regresión logística. La regresión logística supone (o define) que el punto de inflexión de la curva en forma de S en la escala de probabilidad está en la probabilidad 0,5. Argumentó que no habría ninguna razón para suponer que el punto de inflexión está efectivamente en la probabilidad 0,5 y que deberíamos elegir un modelo de regresión diferente que permita que el punto de inflexión varíe de forma que la posición real dependa de los datos.

Al principio me sorprendió su argumento, ya que nunca había pensado en este punto. No tenía ningún argumento de por qué estaría justificado suponer que el punto de inflexión está en 0,5. Después de investigar un poco, sigo sin tener una respuesta a esta pregunta.

He encontrado la regresión logística de 5 parámetros, para la que el punto de inflexión es un parámetro adicional, pero parece que este modelo de regresión se utiliza normalmente cuando se producen curvas dosis-respuesta con un resultado continuo. No estoy seguro de si puede extenderse a las variables de respuesta binarias ni de cómo hacerlo.

Supongo que mi pregunta principal es por qué o cuándo está bien suponer que el punto de inflexión de una regresión logística está en 0,5. ¿Importa siquiera? Nunca he visto a nadie ajustando un modelo de regresión logística y discutiendo explícitamente la cuestión del punto de inflexión. ¿Existen alternativas para crear una curva dosis-respuesta en la que el punto de inflexión no esté necesariamente en 0,5?

Sólo para completar, el código R para generar la imagen anterior:

dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")

Editar 1:

Sólo para añadir a lo que dijo Scortchi en uno de los comentarios: El revisor efectivamente argumentó que biológicamente podría ser más probable que el cambio de curvatura ocurra antes de 0,5. Por eso su resistencia a asumir que el punto de inflexión está en 0,5.

Editar 2:

Como reacción al comentario de Frank Harrell:

Como ejemplo, he modificado mi modelo anterior para incluir un término cuadrático y otro cúbico en gre (que es la "dosis" en este ejemplo).

logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+  gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

enter image description here

A pesar de que probablemente no tenga sentido sumar una cuadrática y una cúbica gre en este caso, vemos que la forma de la curva dosis-respuesta ha cambiado. De hecho, ahora tenemos dos puntos de inflexión en torno a 0,25 y cerca de 0,7.

2 votos

¿No es lo mismo que pedir que se investiguen las relaciones no lineales de los predictores con las probabilidades logarítmicas de respuesta?

8voto

dan90266 Puntos 609

Como ha comentado @scortchi, el revisor estaba operando bajo la falsa impresión de que no es posible modelar los efectos no lineales de los predictores en la escala logit en el contexto de la regresión logística. El modelo original se apresuró a asumir la linealidad de todos los predictores. Al relajar el supuesto de linealidad, utilizando por ejemplo splines cúbicos restringidos (splines naturales), toda la forma de la curva es flexible y el punto de inflexión ya no es un problema. Si hubiera habido un único predictor y se hubiera ampliado utilizando un spline de regresión, se podría decir que el modelo logístico sólo hace los supuestos de suavidad e independencia de las observaciones.

0 votos

Tengo que admitir que no estoy muy familiarizado con la regresión spline. ¿Cómo podría hacer esto junto con la regresión logística (en R). He modificado mi post original (edición 2) para incluir términos polinómicos en el predictor. ¿Podría utilizar esto como alternativa a la suavización spline. Por supuesto no tengo la misma flexibilidad que tendría con los splines.

1 votos

@Franco: Estrategias de modelado de regresión propias de Frank Harrell - libro , sitio web , Paquete R - debería ponerte en marcha. Una breve discusión de algunas de las ventajas de las splines de regresión es aquí pero tienes razón en que los polinomios son una alternativa.

4voto

Jeff Bauer Puntos 236

Me parece que el crítico sólo buscaba algo que decir. Antes de examinar tales características del pliego de condiciones, como el punto de inflexión implícito, hay una tonelada de suposiciones que hemos hecho, para llegar a un modelo estimable. Todo podría ser cuestionado y debatido -siendo el uso de la propia función logística un posible objetivo principal: ¿quién nos dijo que la distribución condicional del término de error subyacente es logística? Nadie.

Así que la cuestión es: ¿qué significa el cambio de curvatura? ¿Qué importancia para el fenómeno del mundo real que se estudia puede tener el punto en el que se produce este cambio de curvatura, de modo que consideremos que se trata de un "dato"? ¿Se aleja del principio de parsimonia?

La pregunta no es "¿por qué el punto de inflexión debe estar en 0,5?". Sino "¿cómo de engañoso puede ser para nuestras conclusiones si se deja en 0,5?".

3 votos

Eso parece poco caritativo. No sabemos si el revisor no tenía buenas razones para cuestionar este supuesto en lugar de otros que podría haber cuestionado. Dejando a un lado una forma impar de expresarlo en términos de puntos de inflexión, y un posible concepto erróneo sobre la regresión logística, básicamente está preguntando por qué el modelo deja que la curva se desplace y se estire pero no se doble, lo que bien podría merecer una respuesta.

0 votos

@Scortchi "impar manera de decirlo"... "un posible error de concepto sobre la regresión logística"... Si esto es lo que se necesita para racionalizar la crítica del revisor, no debería haber revisado el artículo después de todo.

1 votos

Al igual que @Scortchi me parece que es un poco demasiado agudo. Muchas de las personas más activas aquí tienen formación en diversas ciencias más que en estadística pura. Ser estadístico, puro o no, no es esencial ni suficiente para dar buenos consejos (aunque en casi todos los casos evidentemente ayudará).

1voto

Esto no es una respuesta, sino algunos comentarios sobre los aspectos topológicos del problema. Probablemente te estoy diciendo cosas que ya sabes.

Desde $H_i(X, \mathbb{Z})$ está generado finitamente, cualquier elemento de $H^i(X, \mathbb{Q}) \cong \text{Hom}(H_i(X, \mathbb{Z}), \mathbb{Q})$ puede elevarse a un elemento de $\text{Hom}(H_i(X, \mathbb{Z}), \frac{1}{m} \mathbb{Z})$ para algunos $m$ y, por tanto, a un elemento de $H^i(X, \frac{1}{m} \mathbb{Z})$ . Así que en la pregunta podemos sustituir $\mathbb{Q}$ por $\frac{1}{m} \mathbb{Z}$ . Equivalentemente podemos decir lo siguiente. La secuencia exacta corta

$$0 \to \mathbb{Z} \xrightarrow{m} \mathbb{Z} \to \mathbb{Z}_m \to 0$$

(permítanme el pecado de usar $\mathbb{Z}_m$ para $\mathbb{Z}/m\mathbb{Z}$ ) induce una secuencia exacta larga

$$\cdots \to H^i(X, \mathbb{Z}) \xrightarrow{m} H^i(X, \mathbb{Z}) \to H^i(X, \mathbb{Z}_m) \to \cdots$$

mostrando que un determinado $\alpha \in H^i(X, \mathbb{Z})$ es un $m^{th}$ o, lo que es lo mismo, se encuentra en la imagen de la multiplicación por $m$ si se encuentra en el núcleo de la reducción-mod- $m$ mapa a $H^i(X, \mathbb{Z}_m)$ . Así que nuestro problema se reduce, más o menos, a la siguiente pregunta:

Dado que es agradable $X$ y $\alpha \in H^i(X, \mathbb{Z}_m)$ ¿Cuándo podemos encontrar un bonito $f : Y \to X$ tal que $f^{\ast}(\alpha) = 0$ ?

(Estoy siendo vago aquí para que la afirmación pueda aplicarse tanto a las versiones algebraicas como topológicas del problema; tengo en mente $f$ un haz de fibras y $X, Y$ de las variedades compactas. Estrictamente hablando, para que esta pregunta sea equivalente a la pregunta original $\alpha$ necesita estar en el núcleo del Bockstein, pero no puedo imaginar que esa condición sea particularmente importante).

Para cualquier $i$ existe una respuesta topológica universal a esta cuestión: pensar en $\alpha$ como un mapa a un espacio Eilenberg-MacLane $X \to B^i \mathbb{Z}_m$ podemos tomar su fibra homotópica, que se encuentra en una secuencia de fibras

$$B^{i-1} \mathbb{Z}_m \to \widetilde{X} \to X \xrightarrow{\alpha} B^i \mathbb{Z}_m.$$

$\widetilde{X}$ es, por definición, el espacio universal dotado de un mapa a $X$ tal que el pullback de $\alpha$ es trivial, y puede considerarse como un haz de fibras sobre $X$ con fibra $B^{i-1} \mathbb{Z}_m$ . Por desgracia, $B^{i-1} \mathbb{Z}_m$ no es realmente un colector en general. Es de suponer que existe una versión más elevada de esta construcción y es a lo que aludías en los comentarios.

Cuando $i = 1$ la fibra de homotopía $\widetilde{X}$ puede tomarse como la cubierta finita que ya ha mencionado; aquí $B^0 \mathbb{Z}_m = Z_m$ es discreto. Cuando $i = 2$ podemos pensar en $B \mathbb{Z}_m$ como el espacio de la lente infinita $S^{\infty} / \mathbb{Z}_m$ y podemos esperar que podamos sustituir la secuencia de fibras anterior por una fibración

$$S^n / \mathbb{Z}_m \to \widetilde{X} \to X$$

con la fibra un espacio de lente finito. Eso podría resolver el problema en el entorno topológico, pero supongo que no en el entorno algebraico.

Cuando $i = 2$ y $m = 2$ es la cuestión de si cada clase en $H^2(X, \mathbb{Z}_2)$ puede ser representado por un haz de espacios proyectivos reales / álgebras matriciales reales. Esto es cierto y es el análogo real del teorema de Serre de que toda clase de torsión en $H^3(X, \mathbb{Z})$ es representable por un haz de espacios proyectivos complejos / álgebras matriciales complejas; aparentemente se debe a E. Strickland .

Para una mayor $i$ no me queda claro que incluso la versión topológica del problema sea resoluble; supongo que una respuesta negativa adecuada a ese problema implicaría una respuesta negativa al problema original?

Editar: Cuando $i = 2$ podemos hacer un poco más de lo que pide la pregunta, al menos en el entorno topológico: en lugar de hacer que cualquier elemento de $H^2(X, \mathbb{Z})$ para tener un $m^{th}$ raíz podemos, de hecho, causar cualquiera de $H^2(X, \mathbb{Z})$ para desaparecer. Si $\alpha$ es un elemento de este tipo, pensado como un mapa $X \to B^2 \mathbb{Z}$ su fibra homotópica se ajusta a una secuencia de fibras

$$B \mathbb{Z} \to \widetilde{X} \to X \to B^2 \mathbb{Z}$$

donde aquí nuestra gracia salvadora es que $B \mathbb{Z} \cong S^1$ puede ser modelado por un colector compacto. Dicho de otra manera, $\alpha$ es la primera clase de Chern de un único principal $\text{U}(1)$ -y se desvanece cuando se extrae del espacio total de este haz.

Por ejemplo, cuando hacemos esto a un generador de $H^2(S^2, \mathbb{Z})$ obtenemos el fibrado de Hopf $S^1 \to S^3 \to S^2$ . Más generalmente, cuando hacemos esto a un generador de $H^2(\mathbb{CP}^n, \mathbb{Z})$ obtenemos el conocido fibrado $S^1 \to S^{2n+1} \to \mathbb{CP}^n$ . La construcción en este caso puede interpretarse como el cálculo de la $2$ -cubierta conectada, y si pudiéramos tomar $i$ -cubiertas conectadas de colectores compactos que seguían siendo colectores compactos para todos $i$ entonces habríamos terminado, pero no creo que eso sea posible; por ejemplo, el $3$ -cubierta conectada de $\text{Spin}(n), n \ge 3$ es $\text{String}(n)$ que no puede ser modelado por un grupo de Lie de dimensión finita.

0voto

Milou Puntos 31

En el caso de la OM, la regresión logit es una opción razonable para la dosis-respuesta. Por supuesto, se puede utilizar probit , log-log, c-log-log link, y comparar la bondad del ajuste (DEV, BIC, CAIC , etc.). Pero la regresión logit más sencilla ofrece una evaluación formal cómoda del punto de inflexión LD50 = -b0/b1. Recordemos que es un punto concreto , para el que obtenemos la mínima incertidumbre (cf. , LD16, LD84 , y cualquier otro tendrá un IC más amplio , ver "Probit analysis" de Finney, 1947 , 1977). En mi experiencia, siempre (?) fue mejor utilizar el logaritmo de la dosis , y luego sólo convertir el IC del 95% en la escala original . ¿Cuál es la naturaleza de las otras covariables en el modelo? Aludo a la posibilidad de utilizar un enfoque multimodelo... ¡Ciertamente los Splines son flexibles, pero la parametría formal se interpreta más fácilmente!

Ver http://www.epa.gov/ncea/bmds/bmds_training/software/overp.htm

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X