Estoy empezando a experimentar con el mgcv
Mi problema es el siguiente: estoy modelando el recuento de un estudio de aves en el espacio, con un número de diferentes variables predictoras de hábitat. Tengo un GAM que tiene una suavidad espacial s(x,y)
y luego diez términos lineales paramétricos. El GAM tiene la forma:
~gam(count ~ s(X,Y) A + B + C + D + E + F + G + H + I + J,
offset = log(d),
family = poisson,
link = log)
Tengo 60 conjuntos de datos diferentes, cada uno de los cuales representa el recuento de una especie específica en el espacio durante un periodo de tiempo concreto, junto con las variables predictoras. Mi objetivo es ajustar un GAM para cada conjunto de datos, de forma automática. Quiero identificar el "mejor" ajuste. Después de leer un poco, la selección de modelos por pasos no parece ser lo más adecuado. También soy consciente de que los términos suaves pueden ser penalizados, seleccionándolos efectivamente fuera del ajuste. Pero no está claro cómo hacer esto con términos paramétricos lineales. Así que agradecería cualquier consejo metodológico sobre cómo automatizar la selección del modelo para mi problema particular.