Tengo algunos datos que pueden ser modelados como tal: cada uno de los datos de la muestra S es una serie de discretos de la señal de los valores de S(tn)∈{−1,1} medido en tiempos de (tn,S)1≤n≤NS. El número de dimensiones de la señal NS de la muestra y los tiempos en que se realizaron las mediciones varían de muestra a muestra: NS≠NS′ tn,S≠tn,S′ en el caso general.
En otras palabras, cada muestra de datos es una serie de "sí o no", responde cuando se le preguntó en varias ocasiones.
Tengo algunos datos de entrenamiento. Ahora, dada una muestra de datos S, me gustaría predecir la respuesta a la siguiente pregunta, en otras palabras: el valor de S(tNS+1). Aún mejor sería que la probabilidad de una respuesta de "no": P(S(tNS+1)=−1).
No tengo idea de cómo hacerlo. Cualquier sugerencia? Arrancadores?
EDIT: si las señales se mide siempre en el mismo horario (tn,S=tn,S′), y hubo un número constante de la señal de las mediciones para cada muestra de datos (NS=N), luego podría producir para cada muestra de datos S un vector de N−1 dimensiones que contienen el N−1 primera señal de mediciones: S=[1,−1,−1,1,1,…]. Medición de S(tN)∈{−1,1} sería la etiqueta asociada a la muestra S. Entonces, el problema se reduce a una clasificación/regresión problema que puede ser resuelto e.g: con SVM lineal. Por desgracia, las diferencias de tiempo entre cada una de las señales de medición son importantes para el experimento.