26 votos

AIC o p-valor: ¿cuál elegir para la selección de modelos?

Soy nuevo en esto de la R pero no estoy seguro de que modelo elegir.

  1. Hice un regresión escalonada hacia delante seleccionando cada variable en función del AIC más bajo. Me encontré con 3 modelos que no estoy seguro de cuál es el "mejor".

    Model 1: Var1 (p=0.03) AIC=14.978
    Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = 12.543
    Model 3: Var1 (p=0.04) + Var2 (p=0.04) + Var3 (p=0.06) AIC= -17.09

    Me inclino por el modelo nº 3 porque tiene el AIC más bajo (he oído que negativo está bien) y los valores p siguen siendo bastante bajos.

    He analizado 8 variables como predictores de la masa de crías y he descubierto que estas tres variables son los mejores predictores.

  2. En mi siguiente paso adelante elegí el Modelo 2 porque aunque el AIC era ligeramente mayor los valores p eran todos menores. ¿Está de acuerdo en que este es el mejor?

    Model 1: Var1 (p=0.321) + Var2 (p=0.162) + Var3 (p=0.163) + Var4 (p=0.222)  AIC = 25.63
    Model 2: Var1 (p=0.131) + Var2 (p=0.009) + Var3 (p=0.0056)                  AIC = 26.518
    Model 3: Var1 (p=0.258) + Var2 (p=0.0254)                                   AIC = 36.905

¡Gracias!

0 votos

¿Podría explicarnos la diferencia entre (1) y (2)? Está claro que algo ha cambiado, porque el modelo 3 de (1) y el modelo 2 de (2) son nominalmente idénticos, pero los valores p y el AIC difieren.

2 votos

Esta pregunta ha sido reenviada dos veces, lo que significa que no sólo tenemos que cerrarlas, sino también la(s) respuesta(s) asociada(s) que ya se le proporcionaron. Le rogamos que registre su cuenta (véase el PREGUNTAS FRECUENTES ), y prestar atención a la política de publicación de StackExchange en el futuro? Gracias.

0 votos

@whuber, me temo que no entiendo bien tu pregunta. Probablemente sea mi falta de conocimientos estadísticos. Pero para tratar de aclarar. El modelo 1 tiene 4 variables, el modelo 2 tiene 3 variables y el modelo 3 tiene 2 variables. Las variables están en el mismo orden en cada modelo (es decir, variable uno = temp en cada modelo). Creo que @GaBorgulya y @djma han respondido perfectamente a mi pregunta. La variable 4 ESTÁ correlacionada con la variable 3. ¡AH-HA! Tiene sentido. ¡Muchas gracias!

36voto

Graviton Puntos 28358

Los valores p individuales pueden inducir a error. Si tiene variables colineales (con alta correlación), obtendrá valores p elevados. Esto no significa que las variables sean inútiles.

Como regla general rápida, seleccionar el modelo con el criterio AIC es mejor que fijarse en los valores p.

Una razón para no seleccionar el modelo con el AIC más bajo es cuando la relación variable/punto de datos es grande.

Tenga en cuenta que la selección del modelo y la precisión de la predicción son problemas algo distintos. Si tu objetivo es obtener predicciones precisas, te sugiero que realices una validación cruzada del modelo separando los datos en un conjunto de entrenamiento y otro de pruebas.

Un documento sobre la selección de variables: Conjuntos estocásticos por pasos para la selección de variables

5 votos

Si su objetivo es la precisión de la predicción, le conviene utilizar el AIC (ya que minimiza la divergencia KL esperada entre el modelo ajustado y la verdad). Si desea un procedimiento de selección de modelos coherente (p fijo, n creciente), puede utilizar, por ejemplo, el BIC. No se recomienda utilizar valores p en la regresión por pasos para seleccionar hipótesis.

9 votos

@emakalic - sólo una nota rápida, que AIC y BIC son básicamente sólo formas de elegir qué p-valor a utilizar, en lugar de hacer algo "fundamentalmente" diferente. Para AIC, tenemos un valor p de $0.154$ y para el BIC tenemos un valor p equivalente a $|t|>\sqrt{\log(N)}$ .

0 votos

Es bueno saberlo. Tengo una pregunta sobre el uso del valor p equivalente al BIC en una regresión por pasos. ¿Sería este un valor estático, es decir, utilizo el valor p inicial establecido para N - k - 1 grados de libertad. ¿O se actualiza dinámicamente en cada paso, con la adición o sustracción de los grados de libertad? ¿Importa?

25voto

pirho Puntos 1387

El AIC es una medida de la bondad del ajuste que favorece un error residual menor en el modelo, pero penaliza la inclusión de más predictores y ayuda a evitar el sobreajuste. En su segundo conjunto de modelos, el modelo 1 (el que tiene el AIC más bajo) puede funcionar mejor cuando se utiliza para la predicción fuera de su conjunto de datos. Una posible explicación de por qué al añadir Var4 al modelo 2 se obtiene un AIC más bajo, pero valores p más altos, es que Var4 está algo correlacionado con Var1, 2 y 3. Por lo tanto, la interpretación del modelo 2 es más fácil. Por tanto, la interpretación del modelo 2 es más sencilla.

-1voto

JohnRos Puntos 3211

El AIC está motivado por la estimación del error de generalización (como el CP de Mallow, el BIC,...). Si desea que el modelo para las predicciones, mejor utilizar uno de estos criterios. Si quiere el modelo para explicar un fenómeno, utilice los p-valores.

Véase también ici .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X