Quiero comparar el ajuste de un modelo lineal (M1) y no lineales del modelo (M2):
- M1: $y = b_0 + b_1x_1 + b_2x_2 + b_3x_1x_2 + \epsilon, \epsilon \sim N(0, \sigma^2)$
- M2: $y = b_0 + b_1x_1 + b_2x_2 + b_1 b_2x_1x_2 + \epsilon, \epsilon \sim N(0, \sigma^2)$
En particular, quiero saber si M1 es significativamente diferente de M2.
Para la estimación de los parámetros, estoy minimizando el de mínimos cuadrados de los errores en lugar de la maximización de la probabilidad a través de la MLE procedimientos. En particular, estoy utilizando la función de R nls() como sigue:
# Creating a sample data set
n <- 50
x1 <- rnorm(n, 1:n, 0.5)
x2 <- rnorm(n, 1:n, 0.5)
b0 <- 1
b1 <- 0.5
b2 <- 0.2
y <- b0 + b1*x1 + b2*x2 + b1*b2*x1*x2 + rnorm(n,0,0.1)
# Actual model fit
M1 <- nls(y ~ b0 + b1*x1 + b2*x2 + b3*x1*x2, start=list(b0=1, b1=0.5, b2=0.5, b3=0.5))
M2 <- nls(y ~ b0 + b1*x1 + b2*x2 + b1*b2*x1*x2, start=list(b0=1, b1=0.5, b2=0.5))
Quiero comparar los modelos utilizando una medida de la relación de ajuste tales como AIC, que se puede hacer en R como sigue:
AIC(M1, M2)
df AIC
M1 5 -88.47849
M2 4 -90.46491
Debido a $\Delta AIC \approx 2$ y de los modelos que se diferencian por un solo parámetro, llego a la conclusión de que ambos de ellos se ajusten a los datos igualmente bien.
Además, quiero saber si el parámetro $b_3$ de M1 significativamente el ajuste utilizando un estadístico de prueba F-test. Esto se puede hacer en R como sigue:
anova(M1, M2)
Analysis of Variance Table
Model 1: y ~ b0 + b1 * x1 + b2 * x2 + b3 * x1 * x2
Model 2: y ~ b0 + b1 * x1 + b2 * x2 + b1 * b2 * x1 * x2
Res.Df Res.Sum Sq Df Sum Sq F value Pr(>F)
1 46 0.40843
2 47 0.40855 -1 -0.00011097 0.0125 0.9115
Mi pregunta es:
- Son estos análisis apropiado?
Más específicamente:
- Puedo usar AIC para comparar los mínimos cuadrados modelos ajustados?
A partir de un par de posts como este uno se ve como AIC debe ser la adecuada. Sin embargo, he visto posts como este uno que indica que el uso de AIC en la no-MLE modelos ajustados podría ser un problema. Entiendo que de los mínimos cuadrados es equivalente a la MLE si el error se distribuye normalmente, pero es cierto incluso para los modelos no lineales?
- ¿Puedo usar un F-test para probar si $b_3$ es significativamente diferente de $b_1 b_2$?
Sé que esos F-test tiene sentido si el modelo anidado, pero no estoy seguro de si es apropiado en este caso.