La identificación/estimación del modelo ARIMA puede verse seriamente afectada por la presencia de una estructura determinista en los datos. La estructura determinista puede incluir pulsos, cambios de nivel/escalón, pulsos estacionales y/o tendencias temporales. Estadísticas para la tendencia de las series temporales en R Sus residuos sugieren que podría ser necesario un enfoque híbrido. La heterogeneidad de la varianza puede tratarse a menudo utilizando GLS (estimación ponderada) en lugar de una transformada de potencia. Véase ¿Cuándo (y por qué) hay que tomar el logaritmo de una distribución (de números)? para una discusión sobre esto. Le sugiero que publique sus datos y trataré de ayudarle más.
EDITADO TRAS LA RECEPCIÓN DE LOS DATOS:
Tomé sus 211 valores mensuales y utilicé AUTOBOX (un programa informático que he ayudado a desarrollar) y solicité un análisis totalmente automático (con detalles paso a paso). Los datos originales (antes de que los torturaras con la diferenciación (inyectando estructura ver ¿Cuáles son las consecuencias de no cumplir los supuestos para los residuos del modelo ARIMA? ) Y tomar registros injustificados . El ACF sugirió una posible estructura ARMA estacionaria sin necesidad de diferenciar. . Obsérvese que la presencia de desplazamientos de nivel/pasos suele estar mal representada por la toma de diferencias, cuando una simple de-significación podría ser más apropiada. La diferenciación innecesaria inyecta estructura en los residuos, lo que hace necesaria la estructura ARMA para remediar/revertir la diferenciación incorrecta. Véase Varianza de la diferencia de $x_{i,t}$ y $x_{i,t+1}$ para examinar el impacto de diferenciar una serie con ruido blanco.
Para ilustrar esto considere el ACF de las primeras diferencias aquí reflejando la desafortunada/desintencionada/incorrecta inyección de estructura.
El modelo que contiene tres desplazamientos escalonados y una estructura ARMA que refleja tanto un período, como tres períodos y una estructura anual (un pulso estacional en el período 11 que comenzó hace 3 años este fenómeno debe ser investigado y confirmado) está aquí y aquí con las siguientes estadísticas. . Se encontraron varios pulsos que sugieren una actividad inusual y que se presentan claramente aquí . Deben investigarse los posibles efectos de las causas de las variables no especificadas.
El gráfico de los residuos está aquí con un ACF que sugiere una suficiencia aproximada El gráfico de previsión está aquí y el diagrama de Real/Fit y Previsión aquí
Obsérvese que he añadido un valor espurio en el periodo de tiempo 212 sólo para mostrar cómo esta anomalía causada por el usuario fue efectivamente descartada, sugiriendo así la solidez del enfoque.
Todo el enfoque que has seguido de tomar dos medicamentos/transformaciones innecesarias y usar herramientas analíticas inadecuadas ha creado un poderoso ejemplo de lo que puede salir mal y lo hizo. El primer paso en la construcción de un modelo ARIMA es examinar la ACF/PACF de la serie original y cuando se realiza un análisis no automático es revisar un gráfico de los datos originales.
No eres el único que intenta formar modelos útiles con datos complicados y herramientas básicas mientras intenta seguir un script que podría haber sido útil para un simple ejemplo de libro de texto. Los errores que has cometido no son en absoluto inusuales. Asumir que es necesario transformar (la diferenciación es una forma de transformación) y tomar registros (una forma de transformación) puede llevar al "embrollo" en el que te encontraste al ser "izado en tu propio petardo", por así decirlo, es decir, "caer en tu propia trampa".
Por último, a menudo vemos efectos trimestrales cuando se trata de datos mensuales, sobre todo en el sector farmacéutico, debido a la forma en que suelen hacer negocios.
En resumen, su análisis muestra dos tipos de errores estadísticos, a saber, la comisión y la omisión, y ha motivado mi respuesta, que pretende enseñar buenas prácticas.
1)Errores de comisión
a) Diferenciación innecesaria b) transformación de potencia innecesaria
2)Errores de omisión
c) no se tratan las anomalías (pulsos puntuales, algunos muy grandes y otros no tanto), pero todos son significativos. d) no se reconocen los cambios de nivel en los datos e) no se ha identificado el efecto del mes 11 en los últimos tres años f) no se identifica el efecto trimestral
Ha pedido detalles/criterios sobre la estrategia de detección de intervenciones:
El criterio utilizado se basa en el trabajo seminal de I. Chang , G. Tiao y, sobre todo, R.Tsay time-series-ls-ao-tc-using-tsoutliers-package-in-r-how dicusses the TSAY procedure . Esta discusión también podría ayudar a Cómo interpretar y hacer previsiones con el paquete tsoutliers y auto.arima . El principal problema del paquete tsoutliers es que requiere que se especifique previamente un modelo ARIMA en lugar de integrar la identificación del modelo ARIMA, la identificación de los valores atípicos, la identificación de la transformación de la varianza y la identificación de los parámetros variables en el tiempo, la estructura dinámica (PDL) para las series causales sugeridas por el usuario, mientras que AUTOBOX (disponible en R) hace todo esto.
0 votos
Pruebas de Ljung-Box para la autocorrelación, no para la estacionalidad/no estacionalidad. Además, ¿qué quiere decir con un modelo parece insignificante ?
0 votos
@RichardHardy. Puedes ver 2 parcelas: La primera parcela ( enlace ), la línea para el valor ajustado coincide bastante con la pendiente, mientras que en el segundo gráfico ( enlace ), el valor ajustado no cumple con la pendiente, se retrasa 1 valor en comparación con el valor original.
1 votos
Muy bien. La significación tiene un significado fijo en estadística y econometría, por lo que sugiero utilizar expresiones alternativas, por ejemplo, decir que el modelo se ajusta mal a los datos .