Si estaban interesados en la instalación de las interacciones de dos entre un lineal de la variable explicativa $a$ y otra variable explicativa $b$ que tiene una relación cuadrática con la variable dependiente $y$, tendría que incluir tanto la interacción con el componente cuadrática y la interacción con el componente lineal en el modelo? E. g.:
$$
y\sim a+b+b^2+ab+ab + ab^2
$$
A su vez la construcción en mi hilo anterior:
La curvatura de los términos y de selección de modelo, si esto fuera un modelo de análisis de selección de uso MuMIn
en R, con muchas variables explicativas, que la obtienen de los modelos que contienen un término de interacción que incluye un término cuadrático $a:b^2$ sólo será válido si el término de interacción con el componente lineal $a:b$ también estuvo presente en ese mismo modelo, así como $a$, $b$ y $b^2$ como efectos directos?
Respuesta
¿Demasiados anuncios?Sí, siempre debe incluir todos los términos, de la orden más alta de todo el camino hasta el término lineal, en la interacción. Hay un par de muy gran hilos en CV que discutir cuestiones relacionadas con la que usted puede encontrar útil de pensar acerca de este:
- ¿Tiene sentido añadir un término cuadrático, pero no el término lineal a un modelo?
- Incluyendo la interacción, pero no los principales efectos en un modelo de
- Hacer todas las interacciones que necesitan sus términos individuales en un modelo?
La respuesta corta es que mediante la no inclusión de ciertos términos en el modelo, puede forzar a las partes de que sea exactamente cero. Esto impone un inflexibilidad a su modelo, que necesariamente provoca un sesgo, a menos que esos parámetros son exactamente cero en la realidad; la situación es análoga a la de la supresión de la intersección (que se puede ver discutido aquí).
Usted también debe ser consciente de que la selección del modelo automática de rutina es peligroso. (Para la historia básica, puede ser útil para leer mi respuesta aquí.) Además de eso, sin embargo, estos algoritmos no "pensar" en términos de las relaciones entre las variables, por lo que no necesariamente mantener el nivel inferior de los términos en el modelo cuando el poder o los términos de interacción están incluidos.