14 votos

Modelos Binarios (Probit y Logit) con un Desplazamiento Logarítmico

¿Alguien tiene una derivación de cómo funciona un desplazamiento en modelos binarios como probit y logit?

En mi problema, la ventana de seguimiento puede variar en longitud. Supongamos que los pacientes reciben una inyección profiláctica como tratamiento. La inyección ocurre en diferentes momentos, por lo que si el resultado es un indicador binario de si ocurrieron algún brote, es necesario ajustar el hecho de que algunas personas tienen más tiempo para presentar síntomas. Parece que la probabilidad de un brote es proporcional a la longitud del período de seguimiento. No está claro para mí matemáticamente cómo un modelo binario con un desplazamiento captura esta intuición (a diferencia de con la Poisson).

El desplazamiento es una opción estándar tanto en Stata (p.1666) como en R, y puedo verlo fácilmente para un Poisson, pero el caso binario es un poco opaco.

Por ejemplo, si tenemos \begin{equation} \frac{E[y \vert x]}{Z}=\exp\{x'\beta\}, \end{equation> esto es algebraicamente equivalente a un modelo donde \begin{equation}E[y \vert x]=\exp\{x'\beta+\log{Z}\}, \end{equation> que es el modelo estándar con el coeficiente en $\log Z$ restringido a $1$. Esto se llama un desplazamiento logarítmico. Tengo problemas para entender cómo funciona esto si reemplazamos $\exp\{\}$ con $\Phi()$ o $\Lambda()$.

Actualización #1:

El caso logit fue explicado abajo.

Actualización #2:

Aquí hay una explicación de lo que parece ser el principal uso de desplazamientos para los modelos no poissonianos como probit. El desplazamiento se puede usar para realizar pruebas de razón de verosimilitud en los coeficientes de las funciones índice. Primero se estima el modelo no restringido y se almacenan las estimaciones. Digamos que se quiere probar la hipótesis de que $\beta_x=2$. Luego se crea la variable $z=2 \cdot x$, se ajusta el modelo eliminando $x$ y utilizando $z$ como un desplazamiento no logarítmico. Este es el modelo restringido. Las pruebas de razón de verosimilitud comparan los dos, y es una alternativa a la prueba de Wald habitual.

9voto

Factor Mystic Puntos 12465

Siempre puedes incluir un desplazamiento en cualquier GLM: es simplemente una variable predictora cuyo coeficiente se fija en 1. La regresión de Poisson solo resulta ser un caso de uso muy común.

Nota que en un modelo binomial, el análogo al log-exposure como desplazamiento es simplemente el denominador binomial, por lo que generalmente no es necesario especificarlo explícitamente. Así como puedes modelar una RV de Poisson como un recuento con log-exposure como desplazamiento, o como una proporción con exposición como un peso, puedes modelar de manera similar una RV binomial como recuentos de éxitos y fracasos, o como una frecuencia con ensayos como un peso.

En una regresión logística, interpretarías un desplazamiento $\log Z$ en términos de las razones de probabilidad: un cambio proporcional en $Z$ resulta en un cambio proporcional dado en $p/(1-p)$.

$$\begin{equation}\begin{split} \log (p/(1-p)) &= \beta' \mathrm{X} + \log Z \\ p/(1-p) &= Z \exp(\beta' \mathrm{X}) \end{split}\end{equation}$$

Pero esto no tiene un significado particular como el log-exposure en una regresión de Poisson. Dicho esto, si la probabilidad binomial es lo suficientemente pequeña, un modelo logístico se aproximará a un modelo de Poisson con enlace logarítmico (ya que el denominador en el LHS tiende a 1) y el desplazamiento se puede tratar como un término de log-exposure.

(El problema descrito en tu pregunta de R vinculada era bastante idiosincrásico.)

0 votos

La parte de ponderación estaba ausente en mi comprensión de la equivalencia de los dos. Eso fue muy útil. Todavía estoy un poco confundido sobre cómo se puede convertir algo como $\Pr(Y=1 \vert X)=\Phi(x'\beta+\ln(t))$ en una afirmación sobre la probabilidad de que un brote sea proporcional a la duración del periodo de seguimiento $t$, aunque puedo ver cómo es creciente en $t.

0 votos

No es la probabilidad, sino el cociente de probabilidades. Con suerte, la edición lo aclara.

0 votos

Expresar el problema en términos de la razón de momios lo hace muy claro. ¿Qué pasa con el probit?

1voto

BlinK_ Puntos 146

Reformular esto como un problema de tiempo hasta el evento, ¿no comprometería un modelo logístico con un desplazamiento de ln(tiempo) efectivamente a una función de supervivencia paramétrica que puede o no ajustarse bien a los datos?

$p/(1-p)=Z*\exp(\text{xbeta})$

$p = [Z*\exp(\text{xbeta})]/[1+Z*\exp(\text{xbeta})]$

Predicción de supervivencia en el tiempo $Z = 1-[Z*\exp(\text{xbeta})]/[1+Z*\exp(\text{xbeta})]$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X