Cuando se modela un modelo de regresión lineal para un conjunto de datos, hay tres opciones para las suposiciones sobre la influencia de los datos categóricos:
1: Asumir que no hay efecto de interacción. La pendiente de la regresión da como resultado $y = _0 + ... + _i*d $ . Pendientes paralelas, secciones Y variables.
2: Supongamos que existe un efecto de interacción. La pendiente de la regresión da como resultado $y = _0...+ _i(d*x)$ . La misma intersección y. Diferentes pendientes según la presencia de la variable ficticia.
3: $y = _0 + ... + _i(d+d*x)$ . Variación de las intersecciones Y y de las pendientes.
Los efectos de interacción podrían descubrirse con un análisis ANOVA, pero ¿cuándo debe utilizarse el tercer modelo?