10 votos

¿Cuál es la diferencia entre la regresión logit-transformados, regresión logística y un logístico modelo mixto?

Supongamos que tengo 10 alumnos, que intentan resolver 20 problemas de matemáticas. Los problemas se anotaron correcta o incorrecta (en longdata) y rendimiento de cada estudiante se puede resumir por una medida de precisión (en subjdata). Modelos 1, 2 y 4 a continuación parecen producir resultados distintos, pero entiendo que haciendo lo mismo. ¿Por qué producen resultados diferentes? (Incluí modelo 3 para referencia).

library(lme4)

set.seed(1)
nsubjs=10
nprobs=20
subjdata = data.frame('subj'=rep(1:nsubjs),'iq'=rep(seq(80,120,10),nsubjs/5))
longdata = subjdata[rep(seq_len(nrow(subjdata)), each=nprobs), ]
longdata$correct = runif(nsubjs*nprobs)<pnorm(longdata$iq/50-1.4)
subjdata$acc = by(longdata$correct,longdata$subj,mean)
model1 = lm(logit(acc)~iq,subjdata)
model2 = glm(acc~iq,subjdata,family=gaussian(link='logit'))
model3 = glm(acc~iq,subjdata,family=binomial(link='logit'))
model4 = lmer(correct~iq+(1|subj),longdata,family=binomial(link='logit'))

15voto

jasonmray Puntos 1303

Los modelos 1 y 2 son diferentes debido a que el primero se transforma la respuesta y la 2ª transforma su valor esperado.

Para el Modelo 1 el logit de cada respuesta está Normalmente distribuida $$\newcommand{\logit}{\operatorname{logit}}\logit Y_i\sim\mathrm{N}\left(\mu_i,\sigma^2\right)$$ con su refiero a ser una función lineal de la predictor & coefficent vectores. $$\mu_i=x_i'\beta$$ y por lo tanto $$ Y_i=\logit^{-1}\left(x_i'\beta+\varepsilon_i\right)$$ Para el Modelo 2 la respuesta en sí misma es normalmente distribuida $$\newcommand{\logit}{\operatorname{logit}} Y_i\sim\mathrm{N}\left(\mu_i,\sigma^2\right)$$ con el logit de su refiero a ser una función lineal de la predictor y coefficent vectores $$\logit\mu_i=x_i\beta$$ y por lo tanto $$ Y_i=\logit^{-1}\left(x_i'\beta\right)+\varepsilon_i$$

Por lo que la varianza de la estructura será diferente. Imaginar la simulación de Modelo 2: la varianza será independiente del valor esperado; y a pesar de que los valores esperados de las respuestas será entre 0 y 1, las respuestas no serán.

Lineal generalizado mixto modelos como el Modelo 4 son diferentes debido a que contienen efectos aleatorios: ver aquí y aquí.

7voto

Sean Hanley Puntos 2428

+1 a @Scortchi, que ha proporcionado una manera muy clara y concisa respuesta. Quiero hacer un par de puntos complementarios. En primer lugar, para el segundo modelo, se especifica que su respuesta de distribución es Gaussiana (un.k.un., normal). Esto debe ser falso, porque cada respuesta se puntúa como correcta o incorrecta. Es decir, cada respuesta es un ensayo de Bernoulli. Por lo tanto, su respuesta de distribución es un Binomio. Esta idea se refleja con exactitud en su código. Luego, la probabilidad que gobierna la respuesta de distribución es una distribución normal, por lo que el enlace debe ser probit, no logit. Por último, si se tratara de una situación real, usted necesita para dar cuenta de los efectos aleatorios para ambos temas y preguntas, ya que es muy improbable que ser idénticos. La forma en que se generan estos datos, el único aspecto relevante de cada persona es su coeficiente intelectual, que se han considerado de forma explícita. Por lo tanto, no hay nada más que necesita ser explicada por un efecto aleatorio en el modelo. Esto también es cierto para las preguntas, debido a variaciones aleatorias en cuestión de dificultad no son parte de los datos de proceso de generación de código.

No quiero ser quisquilloso aquí. Reconozco que la configuración es simplemente diseñado para facilitar su pregunta, y que ha servido a ese propósito; @Scortchi fue capaz de responder a sus preguntas de forma muy directa, con un mínimo de alboroto. Sin embargo, he de decir estas cosas, ya que ofrecen oportunidades adicionales para entender la situación que están enfrentando, y porque no se han dado cuenta de que el código coincide con algunas partes de su historia, pero otros no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X