4 votos

Es AIC apropiado para la selección de modelos cuando los parámetros se ajustan por mínimos cuadrados en lugar de MLE

Quiero comparar el ajuste de un modelo lineal (M1) y no lineales del modelo (M2):

  • M1: $y = b_0 + b_1x_1 + b_2x_2 + b_3x_1x_2 + \epsilon, \epsilon \sim N(0, \sigma^2)$
  • M2: $y = b_0 + b_1x_1 + b_2x_2 + b_1 b_2x_1x_2 + \epsilon, \epsilon \sim N(0, \sigma^2)$

En particular, quiero saber si M1 es significativamente diferente de M2.

Para la estimación de los parámetros, estoy minimizando el de mínimos cuadrados de los errores en lugar de la maximización de la probabilidad a través de la MLE procedimientos. En particular, estoy utilizando la función de R nls() como sigue:

# Creating a sample data set
n <- 50
x1 <- rnorm(n, 1:n, 0.5)
x2 <- rnorm(n, 1:n, 0.5) 
b0 <- 1
b1 <- 0.5
b2 <- 0.2
y <- b0 + b1*x1 + b2*x2 + b1*b2*x1*x2 + rnorm(n,0,0.1)
# Actual model fit
M1 <- nls(y ~ b0 + b1*x1 + b2*x2 + b3*x1*x2, start=list(b0=1, b1=0.5, b2=0.5, b3=0.5))
M2 <- nls(y ~ b0 + b1*x1 + b2*x2 + b1*b2*x1*x2, start=list(b0=1, b1=0.5, b2=0.5))

Quiero comparar los modelos utilizando una medida de la relación de ajuste tales como AIC, que se puede hacer en R como sigue:

AIC(M1, M2)
   df       AIC
M1  5 -88.47849
M2  4 -90.46491

Debido a $\Delta AIC \approx 2$ y de los modelos que se diferencian por un solo parámetro, llego a la conclusión de que ambos de ellos se ajusten a los datos igualmente bien.

Además, quiero saber si el parámetro $b_3$ de M1 significativamente el ajuste utilizando un estadístico de prueba F-test. Esto se puede hacer en R como sigue:

anova(M1, M2)
Analysis of Variance Table

Model 1: y ~ b0 + b1 * x1 + b2 * x2 + b3 * x1 * x2
Model 2: y ~ b0 + b1 * x1 + b2 * x2 + b1 * b2 * x1 * x2
  Res.Df Res.Sum Sq Df      Sum Sq F value Pr(>F)
1     46    0.40843                              
2     47    0.40855 -1 -0.00011097  0.0125 0.9115

Mi pregunta es:

  • Son estos análisis apropiado?

Más específicamente:

  • Puedo usar AIC para comparar los mínimos cuadrados modelos ajustados?

A partir de un par de posts como este uno se ve como AIC debe ser la adecuada. Sin embargo, he visto posts como este uno que indica que el uso de AIC en la no-MLE modelos ajustados podría ser un problema. Entiendo que de los mínimos cuadrados es equivalente a la MLE si el error se distribuye normalmente, pero es cierto incluso para los modelos no lineales?

  • ¿Puedo usar un F-test para probar si $b_3$ es significativamente diferente de $b_1 b_2$?

Sé que esos F-test tiene sentido si el modelo anidado, pero no estoy seguro de si es apropiado en este caso.

171voto

Nick Cox Puntos 22819

Esto puede que no sea la respuesta que buscas, pero en general

  • Lo primero que hay que comprobar es cómo cerrar $b_3$ en M1 es $b_1 b_2$ en M2 y si los valores de la predicción coinciden entre sí. AIC y pruebas de F dirá qué tan bien cada modelo se ajusta, pero no dicen nada acerca de cómo los modelos difieren. Simple numérica y gráfica de las comparaciones pueden decir más.

  • En M1, el valor de $b_3$, libre y en M2 es limitada. Si el criterio es la cercanía de ajuste a los datos en algún sentido absoluto, entonces no sería sorprendente si un restringida de ajuste fueron mejores. De lo contrario, la comparación de la bisagra, precisamente, sobre si y cómo se penaliza a ti mismo para el uso de un parámetro más en M1. Así que, mire: usted no va a obtener nada de la AIC o similares o disímiles figuras de mérito que no es una consecuencia estricta de cómo se definen. Que sin duda es obvio, pero es importante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X