Soy nuevo en la aplicación de ML a los datos de series temporales, pero tengo experiencia en el aprendizaje supervisado general. Tengo series temporales que son multidimensionales (es decir, varias variables a lo largo del tiempo) con una variable de salida. He intentado seguir algunos tutoriales en línea, pero estoy confundido en algunos puntos que siguen apareciendo.
Algunos tutoriales hacen hincapié en comprobar si las variables son estacionarias (normalmente lo hacen mediante una prueba de Dickey-Fuller).
- ¿Tengo que comprobar cada característica de mi serie temporal para esto o sólo la variable de salida?
- ¿Puedo mantener en las características individuales que no son estacionarias?
- ¿Tengo que comprobar si mi conjunto de datos (características o variable de salida) está autocorrelacionado?
- ¿Tengo que excluir las que estén demasiado autocorrelacionadas?
- ¿Hay algo más que hacer y no hacer para el análisis predictivo de series temporales?
Parece que si simplemente retraso mis características con la salida, entonces puedo aplicar fácilmente modelos de aprendizaje supervisado como la regresión lineal múltiple o los bosques aleatorios si hago una validación cruzada de manera especial. ¿Es realmente todo lo que tengo que hacer para convertir mis series temporales en una tarea de aprendizaje supervisado?