¿Cuáles son algunas maneras de preparar/pre-proceso de datos de series de tiempo para el uso de la serie de datos como un predictor(s) en un modelo predictivo (clasificación o regresión)? Específicamente, ¿cuáles son los métodos a ser considerados con el fin de
- Conseguir el la mayoría de los predicatively señal útil de los datos?
- Reducir la dimensionalidad de la serie
Como un ejemplo concreto, tengo 90 días de acabar con los datos de equilibrio (cantidad en depósito en una cuenta de cheques). Quiero usar los datos para predecir si el propietario de la cuenta se cerrará en las próximas 2 semanas (tengo un indicador de que esto ocurra o no 2 semanas después del final de la serie).
ADEMÁS:
Después de revisar las respuestas, creo que estaba buscando una lista de las técnicas comúnmente usadas.
- No hay duda de que son la característica de la creación en la que Matt Krause escribió acerca de (cada uno de los clientes saldo de la serie son tratados por separado en todos estos métodos): Cosas como las diferencias y % cambios en los valores de la serie cada día o cada semana. Hay ventana deslizante aggrgations como promedios semanales, min, max y variaciones estándar. También el número de aumentos y disminuciones de indicadores de los cambios en los saldos (absoluta o relativa de un cierto tamaño).
- He considerado la colocación de una lineal o regresión polinomial para cada serie y el uso de los coeficientes en el modelo como predictores.
- Otras cosas que me he preguntado acerca de cada serie de equilibrio calcular el auto correlaciones para un número máximo de retardos y utilizar estos valores como predictores.
- Clúster de la serie de tiempo en un número relativamente pequeño de valores y uso de los indicadores para el grupo de pertenencia como predictores (uso de tiempo dinámicos de deformación de la distancia y la agrupación jerárquica, por ejemplo).
¿Hay otros?
- Por ejemplo, hacer las transformadas de Fourier de trabajo aquí? Me pueden enviar una pregunta por separado sobre ellos.