Considere la posibilidad de un modelo lineal como
$$\mathbb{E}[Y] = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 (X_1 \times X_2).$$
When $X_1$ and $X_2$ are categorical, this is pure nonsense until somehow the categories have been encoded as numbers. The default in R
, for binary categories, is to encode the first category as $0$ and the second as $1$. Let the categories for $X_i$ be $a_i, b_i$ (in that order). With the default coding, the four possible cases (given by the $2 \times 2$ possible combinations of values of the $X_i$) are:
$$\eqalign{
X_1=a_1,\ X_2=a_2: &\mathbb{E}[y] = \beta_0 \\
X_1=b_1,\ X_2=a_2: &\mathbb{E}[y] = \beta_0 + &\beta_1 \\
X_1=a_1,\ X_2=b_2: &\mathbb{E}[y] = \beta_0 + &&\beta_2 \\
X_1=b_1,\ X_2=b_2: &\mathbb{E}[y] = \beta_0 + &\beta_1 + &\beta_2 + \beta_3
}$$
Suppose now that we switch the numeric codes, so that the $a_i$ are coded as $1$ and the $b_i$ as zero. Now the model is
$$\eqalign{
X_1=a_1,\ X_2=a_2: &\mathbb{E}[y] = \beta'_0 + &\beta'_1 + &\beta'_2 + \beta'_3 \\
X_1=b_1,\ X_2=a_2: &\mathbb{E}[y] = \beta'_0 + &&\beta'_2 \\
X_1=a_1,\ X_2=b_2: &\mathbb{E}[y] = \beta'_0 + &\beta'_1 \\
X_1=b_2,\ X_2=b_2: &\mathbb{E}[y] = \beta'_0
}$$
They are the same model but with different parameterizations. By comparing these two sets of formulas and solving we find the reparameterization is
$$\beta'_0 = \beta_0 + \beta_1 + \beta_2 + \beta_3,\ \beta'_1 = -(\beta_1+\beta_3),\ \beta'_2 = -(\beta_2+\beta_3),\ \beta'_3 = \beta_3.$$
In the first model $\beta_1, \beta_2,$ and $\beta_3$ were all found to be significantly different from zero. In the second model "one of the factors"--let's say $X_1$--was not significant. That means $\beta'_1 = -(\beta_1+\beta_3)$ was not significantly different from zero. Evidently that is possible when $\hat{\beta_1}\approx -\hat{\beta_3}$. Porque las parametrizaciones de los que tienen significados diferentes, el valor predeterminado de las pruebas de significación evaluar los diferentes hipótesis en los dos esquemas de codificación.
Para modelos más complejos, tales como los modelos mixtos e incluso de modelos no lineales, el mismo razonamiento se aplica: el cambio de la codificación de los cambios de la parametrización y el significado de incumplimiento de las pruebas de significación.
La lección aquí es que la interpretación de la producción estadística con las variables categóricas depende de cómo esas variables están codificadas numéricamente. En particular, las pruebas de significación depende de la codificación.