Sólo una pregunta general. ¿Si tienes datos de series temporales, Cuándo es mejor usar técnicas de series de tiempo (también conocido como ARCH, GARCH, etcetera) sobre la máquina, aprendizaje de técnicas (KNN, regresión) estadística? Si hay una pregunta similar que existe en crossvalidated, por favor punto me hacia él, Miró y no pudo encontrar uno.
Respuestas
¿Demasiados anuncios?Típico de los métodos de aprendizaje automático asumir que sus datos es independiente e idénticamente distribuidas, lo cual no es cierto para los datos de series de tiempo. Por lo tanto, están en una situación de desventaja en comparación con las series de tiempo de las técnicas, en términos de precisión. Para ejemplos de esto, vea las preguntas anteriores Pedidos de series de tiempo para el aprendizaje de máquina y Random forest es el sobreajuste.
Como @Tom Minka señalado la mayoría ML técnicas de asumir iid entradas. Hay un par de soluciones:
Uno puede usar todo el tiempo pasado de la serie de muestras en el sistema de la "Memoria" como una de las características del vector, es decir: x=[x(t-1),x(t-2),...x(t-M)]. Sin embargo, este tiene 2 problemas: 1) según el agrupamiento, usted puede tener una gran característica de vector 2 - algunos métodos requieren de las funciones dentro de la función vectorial a ser independiente, que no es el caso aquí.
Existen muchos ML técnicas que están específicamente diseñados para tales datos de series de tiempo, por ejemplo, Modelos Ocultos de Markov, que se han utilizado con mucho éxito para la incautación de la detección, procesamiento de voz, etc...
Por último, un enfoque que he tomado es el uso de 'extracción de características técnicas para convertir una dinámica de regresión problema (que tiene el elemento de tiempo) en una estática. Por ejemplo, el Director de la Dinámica de Modo (PDM) el enfoque de los mapas de la entrada más allá de la característica de vector ([x(t-1),x(t-2),...x(t-M)]) en una estática ([v(1),v(2),..v(L)]) por convolving el pasado con un sistema específico lineal filterbank (PDMs), ver Marmarelis, 2004 libro o Marmarelis, Vasilis Z. "metodología de Modelado no lineal de los sistemas fisiológicos." Anales de ingeniería biomédica 25.2 (1997): 239-251...