7 votos

Cómo ponderar a la baja los datos más antiguos en la regresión de series temporales

En un ajuste de regresión de vectores que varían con el tiempo $t$
$\qquad y \sim [x_t\ x_{t-1}\ x_{t-2}\ ...] \cdot [c_t\ c_{t-1}\ c_{t-2} \ ...] $ ,
cómo se puede rebajar el peso de los mayores $x_t$ para modelar "la edad es menos relevante" (que la regresión da)?
Digamos que las filas de la matriz de datos $X$ son observables (acciones, segmentos de mercado...) y las columnas son tiempos. Corríjame, Mínimos cuadrados ponderados pondera las filas; ¿cómo se ponderan las columnas, los tiempos?

Añadido: La ponderación a la baja de los datos más antiguos en las series temporales parece compleja, mucho más que
mínimos cuadrados lineales con errores i.i.d. en las filas (observaciones) -- sólo hay que dividir por $\sigma_i$ o
clasificación con errores i.i.d. en columnas (por ejemplo, características) -- sólo hay que centrar cada columna.
¿Puede alguien decir

  • Sí, yo pongo una ponderación inferior a la de las series temporales; aquí hay algunos ejemplos en la web
  • no: ponderación a la baja de las series temporales es complejo, no para los novatos.

( http://AndrewGelman.com/2005/06/21/timeseries_regr discutió esta cuestión hace 10 años, mencionando los filtros de Kalman y el Bayes jerárquico, pero sin ejemplos).

2voto

Geoff Moller Puntos 335

Un método habitual es utilizar una función de costes ponderada exponencialmente: $$ \sum_i \lambda^{i} e(t-i)^2 $$ donde $e(t)$ es el error residual, y $\lambda$ es la tasa de olvido. Si $\lambda=1$ se obtiene de nuevo la regresión por mínimos cuadrados.

Puede utilizar mínimos cuadrados recursivos (RLS) para encontrar una solución eficaz.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X