Después de la lectura de uno de los "consejos de Investigación" de R. J. Hyndman acerca de la validación cruzada y series de tiempo, volví a una vieja pregunta de la mina que voy a intentar formular aquí. La idea es que en la clasificación o regresión de los problemas, la ordenación de los datos no es importante, y por lo tanto k-fold cross-validation puede ser utilizado. Por otro lado, en las series de tiempo, el orden de los datos es, obviamente, de una gran importancia.
Sin embargo, cuando se utiliza una máquina de aprendizaje modelo de pronóstico de series de tiempo, una estrategia común es remodelar la serie {y_1, ..., y_T} en un conjunto de "entrada-salida de vectores" que, durante un tiempo t, tienen la forma (y_{t-n+1}, ..., y_{t-1}, y_{t}; y_{t+1}), lo siento por los de látex-sy notación.
Ahora, una vez que esta remodelación que se ha hecho, podemos considerar que el conjunto resultante de "entrada-salida de vectores" no necesita ser ordenado? Si utilizamos, por ejemplo, un feed-forward de la red neuronal con n entradas para "aprender" a estos datos, se podría llegar a los mismos resultados sin importar el orden en que se muestran los vectores de la modelo. Y por lo tanto, podríamos utilizar el k-fold cross-validation la forma estándar, sin la necesidad de re-ajuste del modelo en cada momento?
Lo siento si esto parece como una pregunta tonta o si ya está contestada en el sitio (no he sido capaz de encontrarlo).
Gracias!