21 votos

¿Por qué esta predicción de series temporales es "bastante pobre"?

Estoy tratando de aprender a usar las redes neuronales. Estaba leyendo este tutorial .

Después de ajustar una Red Neural en una Serie de Tiempo usando el valor en $t$ para predecir el valor a $t+1$ el autor obtiene la siguiente gráfica, donde la línea azul es la serie temporal, la verde es la predicción sobre los datos del tren, la roja es la predicción sobre los datos de la prueba (usó una división del tren de prueba) p1

y lo llama "Podemos ver que el modelo hizo un trabajo bastante pobre al ajustar tanto el entrenamiento como los conjuntos de datos de prueba. Básicamente predijo el mismo valor de entrada que el de salida".

Entonces el autor decide utilizar $t$ , $t-1$ y $t-2$ para predecir el valor a $t+1$ . Al hacerlo obtiene

p2

y dice: "Mirando el gráfico, podemos ver más estructura en las predicciones".

Mi pregunta

¿Por qué es el primer "pobre"? ¡Se ve casi perfecto para mí, predice cada cambio perfectamente!

Y de manera similar, ¿por qué es mejor el segundo? ¿Dónde está la "estructura"? A mí me parece mucho más pobre que la primera.

En general, ¿cuándo es buena la predicción de una serie temporal y cuándo es mala?

4 votos

Como comentario general, la mayoría de los métodos de ML son para el análisis transversal, y necesitan ajustes para ser aplicados a las series temporales. La razón principal es la autocorrelación de los datos, mientras que en el ML los datos se suponen a menudo independientes en la mayoría de los métodos populares

13 votos

Hace un gran trabajo al predecir cada cambio... ¡justo después de que ocurra!

0 votos

@hobbs , no estoy tratando de usar t, t-1, t-2 etc para predecir t+1. Me preguntaba si sabes cuántos términos del pasado es mejor utilizar. Si usamos demasiados, ¿estamos sobreajustando?

32voto

jgradim Puntos 1143

Es una especie de ilusión óptica: el ojo mira el gráfico y ve que los gráficos rojo y azul están justo al lado. El problema es que están uno al lado del otro horizontalmente pero lo que importa es el vertical distancia. El ojo ve más fácilmente la distancia entre las curvas en el espacio bidimensional del gráfico cartesiano, pero lo que importa es la distancia unidimensional dentro de un valor t particular. Por ejemplo, supongamos que tenemos los puntos A1= (10,100), A2 = (10,1, 90), A3 = (9,8,85), P1 = (10,1,100,1) y P2 = (9,8, 88). Naturalmente, el ojo va a comparar P1 con A1, porque es el punto más cercano, mientras que P2 se va a comparar con A2. Como P1 está más cerca de A1 que P2 de A3, P1 va a parecer una predicción mejor. Pero cuando comparas P1 con A1, sólo estás viendo lo bien que A1 es capaz de repetir lo que vio antes; con respecto a A1, P1 no es una predicción . La comparación adecuada es entre P1 contra A2, y P2 contra A3, y en esta comparación P2 es mejor que P1. Habría sido más claro si, además de trazar y_actual y y_pred contra t, hubiera habido gráficos de (y_pred-y_actual) contra t.

2 votos

Esta es la mejor respuesta, ya que la otra ni siquiera menciona por qué un pronóstico "bonito" es en realidad pobre, mientras que tú haces un gran trabajo al respecto.

21voto

Joseph Paterson Puntos 306

¿Por qué la primera es "pobre"? A mí me parece casi perfecta, predice ¡cada uno de los cambios perfectamente!

Se trata de una previsión llamada "desplazada". Si se observa con más detenimiento el gráfico 1, se ve que el poder de predicción sólo consiste en copiar casi exactamente el último valor visto. Eso significa que el modelo no ha aprendido nada mejor, y trata la serie temporal como un paseo aleatorio. Supongo que el problema puede estar en el hecho de que utiliza el crudo datos que alimenta a la red neuronal. Estos datos son no estacionario que causa todos los problemas.

10 votos

En previsión, esto se llama previsión "ingenua", es decir, utilizar lo último observado como previsión

0 votos

¡Gracias! @Aksakal ¿sabes cuántos valores anteriores se deben utilizar para la predicción?

0 votos

Centrarse en la estacionalidad. Un par de rezagos estacionarios deberían ser bastante buenos para esta serie temporal. Mejor que 100 rezagos no estacionarios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X