1 votos

Modelo predictivo a partir de datos secuenciales R

Tengo un problema de predicción como el siguiente:

Mis predictores son secuencias y mi variable de resultado una binaria.

Ejemplo de datos: secuencias de 100 valores y 1 variable de resultado.

set.seed(1)
data = matrix(sample(seq(-10, 10, 0.1), 20000, replace = T)
              , 20, 100)
data = as.data.frame(data)
data$outcome = sample(c(0,1), 20, replace = T)

Ahora quiero ver lo bien que las secuencias predicen el resultado.

Si hago una clasificación normal como (sin ninguna división de datos para esta ilustración):

library(caret)
pred_model = train(outcome ~ .
                   , data = data
                   , method = "svmLinear")

... Descuido el hecho de que los 100 predictores tienen que estar en esa secuencia y no ordenados.

Mi pregunta es: ¿qué algoritmos puedo utilizar para asignar una secuencia a un único valor?

En principio, podría tratar la secuencia como una serie temporal, pero entonces también: qué algoritmos pueden predecir un resultado basándose en una serie temporal.

Supongo que este es un problema común en otras disciplinas además de la mía, así que cualquier indicación sería muy apreciada.

(Preferiblemente, buscaría una implementación en R)

0 votos

Sí, los intervalos son exactamente iguales.

0voto

rajakvk Puntos 1965

Para los resultados dicotómicos en un modelo longitudinal, intente utilizar un glmm en glmer en r. Puedo mejorar esta respuesta basándome en sus comentarios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X