Tengo un conjunto de datos que contiene 4 predictores (condiciones ambientales y tamaño del animal) y una variable predicha (tasa de crecimiento del animal). Quiero ajustar un modelo de regresión a estos datos. Tengo dos objetivos:
-
Comprobar la importancia y las interacciones entre los predictores. Lo que más me interesa son las interacciones entre el tamaño y otros predictores, ya que tengo alguna pista de que el animal debe cambiar sus reacciones a los factores ambientales a medida que crece. Pero otras interacciones también pueden ser interesantes y no estoy seguro de si puedo (o debo) eliminar algunas interacciones del modelo. Quiero probarlo utilizando la prueba t para los coeficientes (calculada automáticamente en R con el ajuste del modelo).
-
Seleccione el mejor modelo para las predicciones futuras. Para ello quiero utilizar el criterio AIC o BIC para todos los posibles submodelos, ya que el número de combinaciones no es tan grande.
La pregunta es:
¿Debo realizar la prueba t después o antes de la selección del modelo? Los dos objetivos mencionados son más o menos independientes, ya que el primero es sólo una visión teórica y el segundo es más práctico. Esto sugiere que debería realizar la prueba t en el modelo completo y la selección del modelo después. Pero no estoy seguro.