15 votos

Pedidos de series de tiempo para el aprendizaje de máquina

Después de la lectura de uno de los "consejos de Investigación" de R. J. Hyndman acerca de la validación cruzada y series de tiempo, volví a una vieja pregunta de la mina que voy a intentar formular aquí. La idea es que en la clasificación o regresión de los problemas, la ordenación de los datos no es importante, y por lo tanto k-fold cross-validation puede ser utilizado. Por otro lado, en las series de tiempo, el orden de los datos es, obviamente, de una gran importancia.

Sin embargo, cuando se utiliza una máquina de aprendizaje modelo de pronóstico de series de tiempo, una estrategia común es remodelar la serie {y_1, ..., y_T} en un conjunto de "entrada-salida de vectores" que, durante un tiempo t, tienen la forma (y_{t-n+1}, ..., y_{t-1}, y_{t}; y_{t+1}), lo siento por los de látex-sy notación.

Ahora, una vez que esta remodelación que se ha hecho, podemos considerar que el conjunto resultante de "entrada-salida de vectores" no necesita ser ordenado? Si utilizamos, por ejemplo, un feed-forward de la red neuronal con n entradas para "aprender" a estos datos, se podría llegar a los mismos resultados sin importar el orden en que se muestran los vectores de la modelo. Y por lo tanto, podríamos utilizar el k-fold cross-validation la forma estándar, sin la necesidad de re-ajuste del modelo en cada momento?

Lo siento si esto parece como una pregunta tonta o si ya está contestada en el sitio (no he sido capaz de encontrarlo).

Gracias!

6voto

jeremcc Puntos 3720

Interesante pregunta!

El enfoque que usted describe es sin duda muy muy utilizado por la gente utilizando el estándar ML de métodos que requieren de longitud fija en función de los vectores de atributos, para analizar datos de series de tiempo.

En el post de que el vínculo, Hyndman señala que existen correlaciones entre los reformados vectores de datos (muestras). Esto podría ser problemático, ya que el k-CV (u otros métodos de evaluación que dividen los datos al azar en la formación y conjuntos de pruebas), se supone que todas las muestras son independientes. Sin embargo, no creo que esta preocupación es relevante para el caso de un estándar ML métodos, que el tratamiento de los atributos por separado.

Para la explicación, me permiten simplificar la notación, asumiendo n=3, por lo que el los primeros vectores de datos (llamados en orden alfabético), será: R: (y_1, y_2, y_3: y_4) B: (y_2, y_3, y_4: y_5) B: (y_3, y_4, y_5: y_6)

Claramente, a y B tienen términos como y_2 en común. Pero, para Una, este es el valor de su segundo atributo, mientras que para B es el valor de su primer atributo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X