Estoy formulando una predicción en un tipo de regresión logística en un modelo GAM.
modelo1 <- gam(hi.lo.arousal ~ s(tiempo) + s(mssd) + s(sum10days),
family = binomial)
Deseo predecir alta excitación en pacientes bipolares, en base a la excitación anterior. Tengo medidas diarias de excitación alta/baja en una serie temporal. Estas están hechas a partir de variables codificadas de 0 a 5 y luego transformadas para ser altas o bajas ((4 o más frente a menos de 4) respectivamente. Los covariables que deseo utilizar en mi modelo son el tiempo pasado en tratamiento, la variabilidad en las puntuaciones (raíz de las diferencias al cuadrado medias sucesivas) y la suma de los valores de 0 a 5 en excitación durante los últimos 10 días. Al formular mi modelo, de alguna manera deseo utilizar la autocorrelación como predictor. Me pregunto si recodifico mis variables de manera que en cada fila obtenga valores sumados de las 10 filas anteriores (una ventana de los últimos 10 días) estaré suavizando la suavidad, o si está bien hacer esto matemáticamente al hacer un gam. Mi pensamiento es: Los covariables que uso me darán una indicación de si el tiempo que los pacientes pasan en terapia, la variabilidad previa en la emoción y el "dolor" previo de los últimos diez días tienen algo que ver en si mis pacientes pierden los estribos en los días siguientes.