Estoy tratando de utilizar el algoritmo ML para hacer la clasificación de datos de series temporales y datos de streaming. Aunque soy capaz de encontrar ciertos algoritmos de ML aplicables a este tipo de datos, tales como la deformación dinámica del tiempo, creo que van a lograr una mejor precisión si se realiza la ingeniería de características, y mi objetivo es utilizar la ingeniería de características para convertir los datos de series temporales en conjuntos de características IID a continuación, utilizar las bibliotecas de aprendizaje automático comunes, tales como previsión aleatoria para hacer el trabajo en estos conjuntos de características IID.
Por lo tanto, mi objetivo es: construir tantos resumidores de los datos de series temporales como sea posible, como mediana/media/máxima y su correspondencia de ventana móvil, y luego utilizar estas características como entrada a bibliotecas de aprendizaje automático para datos de IID, como la previsión aleatoria.
No he podido encontrar ninguna introducción exhaustiva sobre las técnicas de ingeniería de características para datos de series temporales y datos de flujo de este tipo. Puede alguien compartir conmigo algunas técnicas comunes, tales como transformaciones comunes en este tipo de datos?