Tengo un problema de predicción como el siguiente:
Mis predictores son secuencias y mi variable de resultado una binaria.
Ejemplo de datos: secuencias de 100 valores y 1 variable de resultado.
set.seed(1)
data = matrix(sample(seq(-10, 10, 0.1), 20000, replace = T)
, 20, 100)
data = as.data.frame(data)
data$outcome = sample(c(0,1), 20, replace = T)
Ahora quiero ver lo bien que las secuencias predicen el resultado.
Si hago una clasificación normal como (sin ninguna división de datos para esta ilustración):
library(caret)
pred_model = train(outcome ~ .
, data = data
, method = "svmLinear")
... Descuido el hecho de que los 100 predictores tienen que estar en esa secuencia y no ordenados.
Mi pregunta es: ¿qué algoritmos puedo utilizar para asignar una secuencia a un único valor?
En principio, podría tratar la secuencia como una serie temporal, pero entonces también: qué algoritmos pueden predecir un resultado basándose en una serie temporal.
Supongo que este es un problema común en otras disciplinas además de la mía, así que cualquier indicación sería muy apreciada.
(Preferiblemente, buscaría una implementación en R)
0 votos
Sí, los intervalos son exactamente iguales.