Realmente creo que esta es una buena pregunta y merece una respuesta. El enlace proporcionado está escrito por un psicólogo que afirma que algún método casero es una mejor manera de hacer el análisis de series temporales que Box-Jenkins. Espero que mi intento de respuesta anime a otros, que tienen más conocimientos sobre series temporales, a contribuir.
Por su introducción, parece que Darlington defiende el enfoque de simplemente ajustar un modelo AR por mínimos cuadrados. Es decir, si quieres ajustar el modelo $$z_t = \alpha_1 z_{t-1} + \cdots + \alpha_k z_{t-k} + \varepsilon_t$$ a la serie temporal $z_t$ , puedes simplemente hacer una regresión de la serie $z_t$ en la serie con retardo $1$ , retraso $2$ y así sucesivamente hasta el lag $k$ utilizando una regresión múltiple ordinaria. Esto está ciertamente permitido; en R, es incluso una opción en el ar
función. La he probado y tiende a dar respuestas similares al método por defecto para ajustar un modelo AR en R.
También aboga por retroceder $z_t$ en cosas como $t$ o poderes de $t$ para encontrar tendencias. De nuevo, esto está absolutamente bien. Muchos libros sobre series temporales tratan este tema, por ejemplo, Shumway-Stoffer y Cowpertwait-Metcalfe. Normalmente, un análisis de series temporales puede proceder de la siguiente manera: se encuentra una tendencia, se elimina, y luego se ajusta un modelo a los residuos.
Pero parece que también defiende el sobreajuste y luego utiliza la reducción del error cuadrático medio entre la serie ajustada y los datos como prueba de que su método es mejor. Por ejemplo:
Creo que los correlogramas son ya obsoletos. Su objetivo principal era de adivinar qué modelos se ajustan mejor a los datos, pero la velocidad de los ordenadores modernos (al menos en la regresión, si no en de series temporales) permite a un trabajador simplemente ajustar varios modelos modelos y ver exactamente cómo se ajusta cada uno, medido por el error medio cuadrático. error. [La cuestión de la capitalización del azar no es relevante para esta La cuestión de la capitalización del azar no es relevante para esta elección, ya que los dos métodos son igualmente susceptibles a este problema].
Esto no es una buena idea porque se supone que la prueba de un modelo es lo bien que puede predecir, no lo bien que se ajusta a los datos existentes. En sus tres ejemplos, utiliza el "error medio cuadrático ajustado" como criterio de calidad del ajuste. Por supuesto, el sobreajuste de un modelo hará que la estimación del error dentro de la muestra sea menor, por lo que su afirmación de que sus modelos son "mejores" porque tienen un RMSE menor es errónea.
En pocas palabras, dado que utiliza un criterio erróneo para evaluar la calidad de un modelo, llega a conclusiones equivocadas sobre la regresión y el ARIMA. Yo apostaría que, si hubiera probado el predictivo capacidad de los modelos en su lugar, ARIMA habría salido ganando. Tal vez alguien pueda probarlo si tiene acceso al libros que menciona aquí .
[Suplemento: para obtener más información sobre la idea de la regresión, puede consultar los libros más antiguos sobre series temporales que se escribieron antes de que el ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Series temporales En el capítulo 11 de 1973 se dedica un capítulo entero a este método y a su comparación con el ARIMA].
2 votos
La mayoría de las respuestas y comentarios aquí se centran en la pregunta más específica hacia el final. Esto es sólo una señal de que el análisis de series temporales es mucho, mucho más que Box-Jenkins o ARIMA. Campos enteros del análisis de series temporales tienen un enfoque bastante diferente (o al menos más general). Los modelos de componentes no observados son sólo uno de varios ejemplos.