He estado ajustando algunos datos de series temporales utilizando un modelo aditivo general de Poisson con el programa SAS PROC GAM
. En general, he hecho que el procedimiento de validación cruzada generalizada incorporado genere al menos un "punto de partida" decente para mi spline único, que es una función no lineal del tiempo junto con un único término paramétrico (el que realmente me interesa).
Hasta ahora, ha funcionado bastante bien, con la excepción de uno de mis conjuntos de datos. Hay 132 observaciones en ese conjunto de datos, y GCV sugiere una spline de 128 grados de libertad. Eso parece... incorrecto. Muy mal. Y lo que es más importante, no es en absoluto estable. Intenté un segundo enfoque, utilizando algo así como un criterio de "Cambio en la estimación" para dejar de añadir grados de libertad cuando la estimación del término paramétrico deja de cambiar, porque ¿por qué seguir añadiendo control si nada es diferente?
El problema es que la estimación no es nada estable. He probado con los siguientes grados de libertad y, como se puede ver, el término paramétrico rebota salvajemente:
DF: Parametric Estimate:
1 -0.76903
2 -0.56308
3 -0.47103
4 -0.43631
5 -0.33108
6 -0.1495
7 0.0743
8 0.33459
9 0.62413
10 0.92161
15 1.88763
20 1.98869
30 2.5223
40-60 had convergence issues
70 7.5497
80 7.22267
90 6.71618
100 5.83808
110 4.61436
128 1.32347
No tengo ninguna intuición sobre lo que debería usar en términos de df para este dato en particular. ¿Alguna otra idea sobre cómo elegir un df? ¿Debería fijarme en la significación del spline?
Mirando un poco más entre df = 10 y df = 15, parece que df = 12 es lo más cercano que se puede llegar a la estimación generada por 128 y todavía estar en el rango de "grados de libertad razonables". Junto con el término lineal, el intercepto y el único término paramétrico, parece un modelo bastante saturado. ¿Está justificado utilizar sólo 12?
Como segunda actualización, cambiar el suavizado de spline(t)
a loess(t)
resulta en unas estimaciones de df mucho más comportadas - ¿debería cambiar al suavizado de loess?