4 votos

Cuestión de renivelación de LME

Estoy en el proceso de relevelling algunos de los factores de un LME uso de R y de haber golpeado a un problema. He reordenado los niveles de los factores para que voy a hablar acerca de los resultados del modelo más fácilmente en relación a mi experimental de la hipótesis.

El modelo es bastante simple: dos factores y una interacción entre los dos. Extrañamente, cuando ejecuto el modelo base antes de relevelling y, a continuación, ejecute el relevelled versión, uno de los factores que fue significativa antes de relevlling es que ahora ya no es importante. Antes de hacer esto, yo había asumido que el resultado sería el mismo antes y después de relevelling. Tanto los factores que me han relevelled tiene sólo dos niveles para ellos, así que estoy un poco confundida ¿por qué esto podría estar sucediendo.

He estado yendo a través de y a través del código en todo el día - pero no tuvo suerte con ella. Es el comportamiento que he observado espera con los LMEs, o es probable que yo he hecho algo mal al cambiar mis niveles de factor?

5voto

jldugger Puntos 7490

Considere la posibilidad de un modelo lineal como

$$\mathbb{E}[Y] = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 (X_1 \times X_2).$$

When $X_1$ and $X_2$ are categorical, this is pure nonsense until somehow the categories have been encoded as numbers. The default in R, for binary categories, is to encode the first category as $0$ and the second as $1$. Let the categories for $X_i$ be $a_i, b_i$ (in that order). With the default coding, the four possible cases (given by the $2 \times 2$ possible combinations of values of the $X_i$) are:

$$\eqalign{ X_1=a_1,\ X_2=a_2: &\mathbb{E}[y] = \beta_0 \\ X_1=b_1,\ X_2=a_2: &\mathbb{E}[y] = \beta_0 + &\beta_1 \\ X_1=a_1,\ X_2=b_2: &\mathbb{E}[y] = \beta_0 + &&\beta_2 \\ X_1=b_1,\ X_2=b_2: &\mathbb{E}[y] = \beta_0 + &\beta_1 + &\beta_2 + \beta_3 }$$

Suppose now that we switch the numeric codes, so that the $a_i$ are coded as $1$ and the $b_i$ as zero. Now the model is

$$\eqalign{ X_1=a_1,\ X_2=a_2: &\mathbb{E}[y] = \beta'_0 + &\beta'_1 + &\beta'_2 + \beta'_3 \\ X_1=b_1,\ X_2=a_2: &\mathbb{E}[y] = \beta'_0 + &&\beta'_2 \\ X_1=a_1,\ X_2=b_2: &\mathbb{E}[y] = \beta'_0 + &\beta'_1 \\ X_1=b_2,\ X_2=b_2: &\mathbb{E}[y] = \beta'_0 }$$

They are the same model but with different parameterizations. By comparing these two sets of formulas and solving we find the reparameterization is

$$\beta'_0 = \beta_0 + \beta_1 + \beta_2 + \beta_3,\ \beta'_1 = -(\beta_1+\beta_3),\ \beta'_2 = -(\beta_2+\beta_3),\ \beta'_3 = \beta_3.$$

In the first model $\beta_1, \beta_2,$ and $\beta_3$ were all found to be significantly different from zero. In the second model "one of the factors"--let's say $X_1$--was not significant. That means $\beta'_1 = -(\beta_1+\beta_3)$ was not significantly different from zero. Evidently that is possible when $\hat{\beta_1}\approx -\hat{\beta_3}$. Porque las parametrizaciones de los que tienen significados diferentes, el valor predeterminado de las pruebas de significación evaluar los diferentes hipótesis en los dos esquemas de codificación.

Para modelos más complejos, tales como los modelos mixtos e incluso de modelos no lineales, el mismo razonamiento se aplica: el cambio de la codificación de los cambios de la parametrización y el significado de incumplimiento de las pruebas de significación.

La lección aquí es que la interpretación de la producción estadística con las variables categóricas depende de cómo esas variables están codificadas numéricamente. En particular, las pruebas de significación depende de la codificación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X