Tengo algunos datos que pueden ser modelados como tal: cada uno de los datos de la muestra $S$ es una serie de discretos de la señal de los valores de $S(t_n) \in \{-1, 1\}$ medido en tiempos de $(t_{n, S})_{1 \leq n \leq N_S}$. El número de dimensiones de la señal $N_S$ de la muestra y los tiempos en que se realizaron las mediciones varían de muestra a muestra: $N_{S} \neq N_{S'}$ $t_{n, S} \neq t_{n, S'}$ en el caso general.
En otras palabras, cada muestra de datos es una serie de "sí o no", responde cuando se le preguntó en varias ocasiones.
Tengo algunos datos de entrenamiento. Ahora, dada una muestra de datos $S$, me gustaría predecir la respuesta a la siguiente pregunta, en otras palabras: el valor de $S(t_{N_S + 1})$. Aún mejor sería que la probabilidad de una respuesta de "no": $P(S(t_{N_S + 1}) = -1)$.
No tengo idea de cómo hacerlo. Cualquier sugerencia? Arrancadores?
EDIT: si las señales se mide siempre en el mismo horario ($t_{n, S} = t_{n, S'}$), y hubo un número constante de la señal de las mediciones para cada muestra de datos ($N_S = N$), luego podría producir para cada muestra de datos $S$ un vector de $N-1$ dimensiones que contienen el $N-1$ primera señal de mediciones: $S = [1, -1, -1, 1, 1, \dots]$. Medición de $S(t_N) \in \{-1, 1\}$ sería la etiqueta asociada a la muestra $S$. Entonces, el problema se reduce a una clasificación/regresión problema que puede ser resuelto e.g: con SVM lineal. Por desgracia, las diferencias de tiempo entre cada una de las señales de medición son importantes para el experimento.