Cuando se modela un modelo de regresión lineal para un conjunto de datos, hay tres opciones para las suposiciones sobre la influencia de los datos categóricos:
1: Asumir que no hay efecto de interacción. La pendiente de la regresión da como resultado y=0+...+i∗d . Pendientes paralelas, secciones Y variables.
2: Supongamos que existe un efecto de interacción. La pendiente de la regresión da como resultado y=0...+i(d∗x) . La misma intersección y. Diferentes pendientes según la presencia de la variable ficticia.
3: y=0+...+i(d+d∗x) . Variación de las intersecciones Y y de las pendientes.
Los efectos de interacción podrían descubrirse con un análisis ANOVA, pero ¿cuándo debe utilizarse el tercer modelo?