14 votos

¿Relación y diferencia entre series temporales y regresión?

¿Qué relación y diferencia hay entre las series temporales y la regresión?

Para modelos y suposiciones ¿es correcto que los modelos de regresión asuman la independencia entre las variables de salida para diferentes valores de la variable de entrada, mientras que el modelo de series temporales no lo hace? ¿Cuáles son otras diferencias?

Para métodos , de un sitio web de Darlington

Existen varios enfoques para el análisis de series temporales, pero los dos más conocidos son el método de regresión y el método Box-Jenkins (1976) o ARIMA (media móvil integrada autorregresiva). Este documento presenta el método de regresión. Considero que el método de regresión es muy superior al ARIMA por tres razones principales

No entiendo muy bien qué es el "método de regresión" para series temporales que aparece en la página web, y en qué se diferencia del método Box-Jenkins o ARIMA. Agradezco si alguien puede dar alguna idea sobre esas cuestiones.

Gracias y saludos.

2 votos

La mayoría de las respuestas y comentarios aquí se centran en la pregunta más específica hacia el final. Esto es sólo una señal de que el análisis de series temporales es mucho, mucho más que Box-Jenkins o ARIMA. Campos enteros del análisis de series temporales tienen un enfoque bastante diferente (o al menos más general). Los modelos de componentes no observados son sólo uno de varios ejemplos.

21voto

Ankur Loriya Puntos 160

Realmente creo que esta es una buena pregunta y merece una respuesta. El enlace proporcionado está escrito por un psicólogo que afirma que algún método casero es una mejor manera de hacer el análisis de series temporales que Box-Jenkins. Espero que mi intento de respuesta anime a otros, que tienen más conocimientos sobre series temporales, a contribuir.

Por su introducción, parece que Darlington defiende el enfoque de simplemente ajustar un modelo AR por mínimos cuadrados. Es decir, si quieres ajustar el modelo $$z_t = \alpha_1 z_{t-1} + \cdots + \alpha_k z_{t-k} + \varepsilon_t$$ a la serie temporal $z_t$ , puedes simplemente hacer una regresión de la serie $z_t$ en la serie con retardo $1$ , retraso $2$ y así sucesivamente hasta el lag $k$ utilizando una regresión múltiple ordinaria. Esto está ciertamente permitido; en R, es incluso una opción en el ar función. La he probado y tiende a dar respuestas similares al método por defecto para ajustar un modelo AR en R.

También aboga por retroceder $z_t$ en cosas como $t$ o poderes de $t$ para encontrar tendencias. De nuevo, esto está absolutamente bien. Muchos libros sobre series temporales tratan este tema, por ejemplo, Shumway-Stoffer y Cowpertwait-Metcalfe. Normalmente, un análisis de series temporales puede proceder de la siguiente manera: se encuentra una tendencia, se elimina, y luego se ajusta un modelo a los residuos.

Pero parece que también defiende el sobreajuste y luego utiliza la reducción del error cuadrático medio entre la serie ajustada y los datos como prueba de que su método es mejor. Por ejemplo:

Creo que los correlogramas son ya obsoletos. Su objetivo principal era de adivinar qué modelos se ajustan mejor a los datos, pero la velocidad de los ordenadores modernos (al menos en la regresión, si no en de series temporales) permite a un trabajador simplemente ajustar varios modelos modelos y ver exactamente cómo se ajusta cada uno, medido por el error medio cuadrático. error. [La cuestión de la capitalización del azar no es relevante para esta La cuestión de la capitalización del azar no es relevante para esta elección, ya que los dos métodos son igualmente susceptibles a este problema].

Esto no es una buena idea porque se supone que la prueba de un modelo es lo bien que puede predecir, no lo bien que se ajusta a los datos existentes. En sus tres ejemplos, utiliza el "error medio cuadrático ajustado" como criterio de calidad del ajuste. Por supuesto, el sobreajuste de un modelo hará que la estimación del error dentro de la muestra sea menor, por lo que su afirmación de que sus modelos son "mejores" porque tienen un RMSE menor es errónea.

En pocas palabras, dado que utiliza un criterio erróneo para evaluar la calidad de un modelo, llega a conclusiones equivocadas sobre la regresión y el ARIMA. Yo apostaría que, si hubiera probado el predictivo capacidad de los modelos en su lugar, ARIMA habría salido ganando. Tal vez alguien pueda probarlo si tiene acceso al libros que menciona aquí .

[Suplemento: para obtener más información sobre la idea de la regresión, puede consultar los libros más antiguos sobre series temporales que se escribieron antes de que el ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Series temporales En el capítulo 11 de 1973 se dedica un capítulo entero a este método y a su comparación con el ARIMA].

0 votos

La cuestión es cuáles son las diferencias (inherentes).

0 votos

Por lo que puedo decir, el autor nunca describió su método casero en una publicación revisada por pares y las referencias hacia y desde la literatura estadística parecen mínimas y sus principales publicaciones sobre temas metodológicos se remontan a los años 70. Estrictamente hablando, nada de esto "demuestra" nada, pero sin el tiempo o la experiencia suficientes para evaluar las afirmaciones por mí mismo, sería extremadamente reacio a utilizar nada de esto.

0 votos

@hbaghishani la diferencia sustantiva es que los datos autocorrelacionados, es decir, dentro de cada serie, distorsionan la interpretación de la correlación cruzada. Además, es necesario considerar/rectificar las violaciones gaussianas, por ejemplo, la media constante de los erros, la varianza constante en el tiempo y los parámetros constantes en el tiempo.

8voto

Owen Fraser-Green Puntos 642

El profesor E. Parzen, quizá con cierta envidia por no haber propuesto los métodos innovadores de Box y Jenkins, sugirió este enfoque de sobreajuste y luego de abandono. Falla por muchas razones (muchas de las cuales Flounderer ha resumido muy bien), entre ellas la de no identificar y remediar los pulsos, los cambios de nivel, los pulsos estacionales y las tendencias temporales locales. Además, hay que tener en cuenta los cambios en los parámetros a lo largo del tiempo o los cambios en la varianza del error a lo largo del tiempo.

Escribí un artículo que podría interesarle. Se llama "Regresión vs Box-Jenkins" y está disponible en http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/24-regression-vs-box-jenkins

Un comentario sobre el procedimiento de Darlington que refleja el tiempo, el tiempo*el tiempo, el tiempo*el tiempo*el tiempo como predictores. En ausencia de una detección de intervenciones que permita aislar los efectos de los valores atípicos, es muy posible (¡e incorrecto!) llegar a conclusiones para potencias de tiempo superiores. Desconfíe de los no estadísticos que realizan análisis estadísticos como desconfíe de los estadísticos que realizan cirugía cerebral. Para ser justos, también se podría añadir que hay que tener cuidado con los estadísticos/matemáticos que no se dedican a las series temporales y que intentan realizar análisis de series temporales con una formación limitada en este campo.

Otros carteles (en particular Whuber) en esta lista han advertido repetidamente contra el uso de este "enfoque de ajuste", sobre todo en un entorno univariante. Esta advertencia también se aplica a los modelos causales.

Espero que esto ayude.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X