5 votos

Inclusión del día de la semana en un modelo logit

Digamos que estoy elaborando un modelo de regresión logística en el que estoy prediciendo algo (y) en función del día de la semana. Sin embargo, el modelo debe tener en cuenta cada uno de los días.

Por lo tanto, en lugar de:

y = B0 + B1*(day)

Donde día es una variable categórica con 7 niveles.

Lo sería:

y = B0 + B1*(monday) + B2*(tuesday) + B3*(wednesday) + ... + B7*(sunday)

Básicamente estoy pensando que cada día necesita un coeficiente separado porque cada tiene un efecto diferente en y. Sin embargo, creo que cada uno tendrá que ser una variable ficticia de modo que para el lunes, 1 es para el lunes, y 0 para el no lunes, y así sucesivamente.

Sólo tengo curiosidad por saber si hay una lógica estadística para hacerlo de la segunda manera con días separados? ¿Cuál es la mejor manera de hacerlo?

13voto

bheklilr Puntos 113

El modelo con el día como variable categórica con siete niveles sí da cuenta de cada uno de los días; no es necesario hacerlo "a mano", por así decirlo.

Por ejemplo:

library(MASS)

# Construct sample data: 700 observations, 100 on each of 7 days of week
Day <- factor(rep(c("Monday","Tuesday","Wednesday","Thursday","Friday","Saturday","Sunday"), 100),
              levels=c("Monday","Tuesday","Wednesday","Thursday","Friday","Saturday","Sunday"),
              ordered=TRUE)
Day.effect <- rep(rnorm(7), 100)
y <- rbinom(700, 1, 1/(1+exp(-Day.effect)))

# Estimate logit model without intercept (captures each day's effect)
foo <- summary(glm(y~Day-1, family=binomial))

# compare actuals to estimates
coefs <- foo$coefficients
coefs <- cbind(Day.effect, coefs)
colnames(coefs)[1] <- "Actual"
options(digits=3)

> coefs
             Actual Estimate Std. Error z value Pr(>|z|)
DayMonday     0.520    0.490      0.206   2.376 1.75e-02
DayTuesday   -0.230   -0.323      0.203  -1.593 1.11e-01
DayWednesday -0.247   -0.447      0.205  -2.182 2.91e-02
DayThursday  -1.156   -1.266      0.241  -5.243 1.58e-07
DayFriday     0.282    0.160      0.201   0.799 4.24e-01
DaySaturday  -0.383   -0.405      0.204  -1.986 4.70e-02
DaySunday    -0.357   -0.447      0.205  -2.182 2.91e-02

Esto parece hacer justo lo que quieres.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X