2 votos

GAM utilizando una spline cíclica mejora la estructura residual pero reduce el ajuste.

Estoy trabajando en un conjunto de datos que monitorea los niveles de humedad del suelo durante el verano. La tendencia general en los datos es la siguiente:

introduzca aquí la descripción de la imagen

Cuando uso un GAM con una placa base delgada y un proceso AR(1) todavía hay un patrón residual claro: introduzca aquí la descripción de la imagen

Ahora, si en su lugar uso una placa cíclica, el patrón residual mejora, pero los valores observados vs. ajustados empeoran un poco, este modelo también tiene un valor de AIC más alto: introduzca aquí la descripción de la imagen

Mi pregunta es si es apropiado optar por la placa cíclica aquí ya que mejora la estructura residual, aunque el ajuste general del modelo sea peor.

0 votos

¿Puede decirnos en qué sentido ha mejorado la estructura residual? ¿Y por qué espera que el nivel de humedad durante el verano sea periódico?

0 votos

En el gráfico de residuos vs. valor predictivo lineal del primer ejemplo (arriba a la derecha), la desviación es mucho mayor para valores predictivos bajos que para valores altos. En el segundo ejemplo esto está más disperso. Sí, esta es exactamente la razón por la que no estaba seguro si el spline cíclico es apropiado, porque la humedad del suelo no es generalmente periódica, sino que disminuye durante el verano y aumenta un poco nuevamente al final cuando vuelven las lluvias, pero solo hasta aproximadamente la mitad del nivel que tenía antes del comienzo del verano.

0 votos

Bueno, el ajuste no es mejor en ninguna parte, simplemente es más homocedástico. ¡Eso parece ser una mala razón para introducir un supuesto de modelado (periodicidad) que sabes que no es verdadero! Si la heterocedasticidad es un problema, habrá mejores formas de manejar eso. Tal vez solo usar errores estándar robustos. Especialmente, al mirar tu primer gráfico, es manifiesto que la varianza es menor en el extremo alto (principios de verano), y ver eso reflejado en el ajuste no puede ser malo.

3voto

kjetil b halvorsen Puntos 7012

La respuesta rápida es NO, no deberías usar splines periódicos. De alguna manera estás intentando solucionar un problema secundario (heterocedasticidad) al no solucionar el problema principal, para que las predicciones sean correctas.

Algunos detalles adicionales: Tu primer gráfico muestra una menor varianza en la parte del principio del verano, y una mayor varianza para finales del verano. En este caso, la menor varianza generalmente se asocia con valores más altos. Las transformaciones se utilizan principalmente para el patrón opuesto, por lo que probablemente no sean de mucha utilidad aquí. Además, complicarán el modelado, así que mantente alejado de las transformaciones.

Tu segundo y tercer gráfico (modelo con splines suavizados) es lo que esperarías en este caso: más variabilidad entre los residuos cuando la varianza en los datos es mayor. Esto es solo una parte del fenómeno a modelar, no realmente un problema. La heterocedasticidad no es lo suficientemente fuerte como para justificar mucho, se podría utilizar una estimación ponderada, pero estimarías los pesos a partir de los datos, probablemente sin ganar mucho y presentando otros problemas (¿cómo obtienes errores estándar correctos cuando se estiman los pesos? Podrías intentar el bootstrapping, mi conjetura es que no ganarías nada...)

Los últimos gráficos (modelo con splines suavizados periódicos) confirman esto: Sí, ahora los residuos tienen una varianza aproximadamente constante, pero ¡es en todas partes más alta! Así que no has ganado nada. Tal vez intenta con errores estándar robustos. Si estás utilizando R, aquí hay algunos consejos y código útiles: Cómo calcular el error estándar robusto de la predicción y de un modelo de regresión lineal en R? (que está cerrado por razones incomprensibles, parece ser comprensible y útil)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X