2 votos

Características de las series temporales para problemas multidimensionales

Soy nuevo en la aplicación de ML a los datos de series temporales, pero tengo experiencia en el aprendizaje supervisado general. Tengo series temporales que son multidimensionales (es decir, varias variables a lo largo del tiempo) con una variable de salida. He intentado seguir algunos tutoriales en línea, pero estoy confundido en algunos puntos que siguen apareciendo.

Algunos tutoriales hacen hincapié en comprobar si las variables son estacionarias (normalmente lo hacen mediante una prueba de Dickey-Fuller).

  1. ¿Tengo que comprobar cada característica de mi serie temporal para esto o sólo la variable de salida?
  2. ¿Puedo mantener en las características individuales que no son estacionarias?
  3. ¿Tengo que comprobar si mi conjunto de datos (características o variable de salida) está autocorrelacionado?
  4. ¿Tengo que excluir las que estén demasiado autocorrelacionadas?
  5. ¿Hay algo más que hacer y no hacer para el análisis predictivo de series temporales?

Parece que si simplemente retraso mis características con la salida, entonces puedo aplicar fácilmente modelos de aprendizaje supervisado como la regresión lineal múltiple o los bosques aleatorios si hago una validación cruzada de manera especial. ¿Es realmente todo lo que tengo que hacer para convertir mis series temporales en una tarea de aprendizaje supervisado?

1voto

Bence Mélykúti Puntos 103
  1. En general, las series temporales multivariantes deben ser estacionarias porque reducen la varianza en el modelo. Sin embargo, esto suele estudiarse caso por caso. La normalización de estas series temporales también puede ser importante.

  2. Se pueden transformar en series temporales estacionarias. Dos métodos principales son el uso de la diferenciación o las transformaciones Box-Cox. Vea esto sección y esto responder para más detalles.

  3. Sin lugar a dudas. Las series temporales altamente correlacionadas hacen que la estimación de los coeficientes de regresión sea difícil desde el punto de vista computacional. Para entender la correlación en las series temporales, primero hay que entender la ACF y la PACF. Estos enlaces ayuda con eso.

  4. Este enlace habla extensamente de la causalidad y la multicolinealidad.

    Es importante entender que las correlaciones son útiles para la previsión, incluso cuando no existe una relación causal entre las dos variables, o cuando la correlación va en sentido contrario al modelo. Sin embargo, a menudo es posible obtener un modelo mejor si se puede determinar un mecanismo causal.

  5. Este enlace debería ayudarle a diferenciar el enfoque de RNN frente al de aprendizaje supervisado para las series temporales. En general, si tiene una serie temporal X = [1,2,3,4,5,6,7,8,9,10] entonces eso podría transformarse en un problema de aprendizaje supervisado como -

    assuming we only consider lag = 1

    X(t) X(t-1) y
    1 2 3
    2 3 4
    3 4 5
    4 5 6
    5 6 7

Se puede ampliar esto para las series temporales multivariantes así -

# assuming we only consider lag = 1
| X1(t) | X1(t-1) | X2(t) | X2(t-1) | y    |
| ----- | ------- | ----- | ------- | ---- |
| 1     | 2       | 50    | 60      | 3    |
| 2     | 3       | 60    | 70      | 4    |
| 3     | 4       | 70    | 80      | 5    |
| 4     | 5       | 80    | 90      | 6    |
| 5     | 6       | 90    | 100     | 7    |

```

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X