6 votos

Cómo calcular la estimación para el primer valor de la serie de tiempo utilizando el modelo ARIMA?

Modelé un univariado de series de tiempo en R usando el Arima comando. Uno puede obtener los valores ajustados para la serie original el uso de este comando mediante la aplicación de la función fitted para el modelo. Sin embargo, me di cuenta de que el conjunto de datos tiene la misma dimensión que el original de datos. Por lo tanto, una cocina equipada de valor para el primer valor de la serie de tiempo se calcula aunque no hay datos anteriores. He comprobado si es la media de la serie o de la intersección de la modelo, pero que no es la solución. ¿Cuáles son los posibles enfoques para conseguir un ajustado valor aquí?

El código siguiente es un reproducible ejemplo de uso de la Lynx conjunto de datos.

> library(xts)
> library(forecast)
> 
> data("lynx")
> 
> Y      <- as.xts(log10(lynx))
> model  <- Arima(Y, order= c(1, 0, 0))  #Fit AR(1) model
> fit    <- fitted(model)
> length(fit) == length(Y)  
[1] TRUE

4voto

icelava Puntos 548

Hay diferentes métodos que se utilizan comúnmente para calcular o establecer los valores iniciales para la serie de tiempo de los algoritmos de modelado.

  • Las más sencillas son las heurísticas, como el uso de la media general, o de la primera observación, o la media de la primera $n$ observaciones, o lo que sea. Estos se utilizan a menudo cuando no hay subyacentes en los modelos estadísticos, o cuando no nos preocupamos de ella, como en la Suavización Exponencial o en Croston, el método intermitente demandas.

  • Por el contrario, se puede tratar no sólo de su AR y MA parámetros como parámetros, pero también a los valores iniciales, y luego optimizar estos mediante la maximización de la probabilidad, asumiendo que usted tiene un modelo estadístico. Condicional sumas de cuadrados son similares, aunque no tengo los detalles prácticos.

A veces se utiliza la heurística incluso si un modelo estadístico que está disponible. Por ejemplo, si usted tiene un largo patrón estacional, dicen semanal de datos con estacionalidad anual, usted tendrá que optimizar una gran cantidad de parámetros, y usted probablemente no tendrá una gran cantidad de datos en comparación con el número de parámetros, de modo que usted puede terminar el sobreajuste si el uso de máxima verosimilitud. En tal caso, tiene sentido el uso de la heurística para computacional y razones de estabilidad.

Finalmente, para su aplicación específica, esto es lo ?Arima dice que para el method parámetro:

El valor predeterminado (si no hay valores perdidos) es el uso de condicional-suma de cuadrados para encontrar los valores de partida, entonces el máximo la probabilidad.

Si usted está interesado en los detalles escabrosos, se podía ver en el código fuente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X