Digamos que estoy elaborando un modelo de regresión logística en el que estoy prediciendo algo (y) en función del día de la semana. Sin embargo, el modelo debe tener en cuenta cada uno de los días.
Por lo tanto, en lugar de:
y = B0 + B1*(day)
Donde día es una variable categórica con 7 niveles.
Lo sería:
y = B0 + B1*(monday) + B2*(tuesday) + B3*(wednesday) + ... + B7*(sunday)
Básicamente estoy pensando que cada día necesita un coeficiente separado porque cada tiene un efecto diferente en y. Sin embargo, creo que cada uno tendrá que ser una variable ficticia de modo que para el lunes, 1 es para el lunes, y 0 para el no lunes, y así sucesivamente.
Sólo tengo curiosidad por saber si hay una lógica estadística para hacerlo de la segunda manera con días separados? ¿Cuál es la mejor manera de hacerlo?