¿Cuál es la mejor manera de dividir los datos de series de tiempo en conjuntos de tren / prueba / validación, donde el conjunto de validación se usaría para el ajuste del hiperparámetro?
Tenemos datos de ventas diarias de 3 años, y nuestro plan es utilizar 2015-2016 como datos de capacitación, luego muestrear al azar 10 semanas de los datos de 2017 para usarlos como conjunto de validación, y otras 10 semanas de datos de 2017 para el conjunto de prueba. Luego, realizaremos una caminata hacia adelante en cada uno de los días en el conjunto de prueba y validación.