9 votos

Codificación de variables categóricas (codificación de dummies vs. efectos) en modelos mixtos

El modelo basado en el experimento es el siguiente:

glmer(Y ~ X*Condition + (X*Condition|subject) + (1+X|Trial))

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects  
# trial = random effects for different trials  

Hasta ahora, pensaba que la interpretación de los efectos de interacción y aleatorios era bastante sencilla:

  • para los efectos fijos:

    • Intercepción - cuál es el valor Y en la condición 0 cuando X es 0
    • X - cuánto cambia Y para un cambio de 1 unidad en X en la condición 0
    • CondiciónB - cuál es la diferencia en la intercepción de la condición B con respecto a la condición A
    • X*CondiciónB - cuál es la diferencia de pendiente entre la CondiciónB y la CondiciónA
  • para los efectos aleatorios:

    • intercepción aleatoria - variabilidad aleatoria alrededor del intercepto
    • random X - variabilidad aleatoria en torno a X
    • aleatoria CondiciónB - variabilidad aleatoria de la diferencia de interceptos entre la CondiciónB y la CondiciónA
    • random X*CondiciónB - variabilidad aleatoria de la diferencia de pendientes entre la CondiciónB y la CondiciónA

Sin embargo, he leído un capítulo muy bien escrito Introducción a los modelos mixtos para la psicología experimental por Henrik Singmann y David Kellen , donde dicen

En otras palabras, un modelo mixto (o cualquier otro modelo de tipo regresión) que incluya interacciones con factores utilizando contrastes de tratamiento produce estimaciones de parámetros así como pruebas de tipo III que a menudo no se corresponden a lo que se quiere (por ejemplo, los efectos principales no son lo que comúnmente se entiende por efecto principal).

El uso de la codificación de efectos se sugiere como una mejor manera de interpretar las interacciones de la variable continua X y la variable categórica Condition . Soy consciente de que la correlación de efectos aleatorios en mayúsculas es algo difícil de interpretar - la correlación de Intercept y X es sencilla, pero la correlación de X y X:ConditionB no lo es, porque correlacionamos los coeficientes con las diferencias de estos coeficientes. Entonces hay que calcular la correlación por mano, como se describe en ¿Cómo calcular la correlación de las pendientes aleatorias para X entre dos condiciones con el modelo (X*Condición|sujeto) en lme4?

Mis preguntas son:

  1. ¿Es válida mi interpretación de los efectos fijos y aleatorios? Si no es así, ¿por qué?

  2. ¿Por qué la codificación de efectos es mejor que la codificación de dummies en los modelos mixtos y cómo se interpreta la codificación de efectos?

1 votos

Creo que el capítulo lo explica bastante bien y una cita más larga daría respuesta a tu pregunta. (Tenga en cuenta que esta pregunta tiene nada con los modelos mixtos). Quizá le confunda que mencionen "efectos simples" y "efectos principales". Véase aquí glimo.vub.ac.be/descargas/simpleeffect.htm o aquí lrdc.pitt.edu/maplelab/slides/Simple_Main_Effects_Fraundorf.pdf (se encuentra buscando en Google; puedes encontrar más fácilmente). Su X coef es un simple efecto porque está en Cond=0. A principal sería un efecto de X "en promedio" (en todas las condiciones). Pero su interp. está bien.

0 votos

Esta es una muy buena explicación de los efectos simples y principales, muy clara y útil. Sin embargo, mi objetivo era comprobar si mi interpretación de los efectos aleatorios es correcta, y parece que sí. Gracias de todos modos.

13voto

Anthony Cramp Puntos 126

Como dice @amoeba en el comentario, la pregunta no es tanto una pregunta de modelo mixto, sino más bien una pregunta general sobre cómo parametrizar un modelo de regresión con interacciones. La cita completa de nuestro capítulo también proporciona una respuesta a tu segunda pregunta (es decir, el por qué):

Un esquema de contraste común, que es el predeterminado en R, se llama contrastes de tratamiento (es decir contr.treatment También se denomina codificación codificación). En los contrastes de tratamiento, el primer nivel del factor sirve como de referencia, mientras que todos los demás niveles se asignan exactamente a una de las variables de contraste con un valor de 1. En consecuencia, el intercepto corresponde a la media del grupo de referencia y no a la media general. Cuando se ajustan modelos sin interacciones, este tipo de contraste tiene tiene la ventaja de que las estimaciones (es decir, los parámetros correspondientes a las variables de contraste) indican si existe una diferencia entre el nivel del factor correspondiente y la línea de base. Sin embargo, cuando Sin embargo, cuando se incluyen interacciones, los contrastes de tratamiento conducen a resultados que son a menudo difíciles de interpretar. Mientras que la interacción de orden superior no se ve de orden superior no se ve afectada, los efectos de orden inferior (como los efectos principales) se de orden inferior (como los efectos principales) se estiman al nivel de la línea de base, lo que efectos simples, en lugar de los efectos de orden inferior que se suelen esperar. de orden inferior. Es importante destacar que esto se aplica tanto a las estimaciones de los parámetros resultantes de los efectos de orden inferior, así como a sus pruebas de tipo III. En otras palabras, un modelo mixto (o cualquier otro modelo de tipo de regresión) que incluya interacciones con factores utilizando contrastes de tratamiento produce estimaciones de parámetros así como pruebas de Tipo III que a menudo no no se corresponden con lo que uno quiere (por ejemplo, los efectos principales no son lo que comúnmente se entiende como efecto principal). Por lo tanto, generalmente Por lo tanto, generalmente recomendamos evitar los contrastes de tratamiento para los modelos que incluyen interacciones.

Los contrastes ortogonales de suma a cero son mejores porque evitan efectos de orden inferior potencialmente difíciles de interpretar. Es decir, para esos contrastes todos los efectos de orden inferior se evalúan en la media general. Para una explicación rápida de la diferencia entre la codificación de los efectos y la de los dummies, véase: http://www.lrdc.pitt.edu/maplelab/slides/Simple_Main_Effects_Fraundorf.pdf

Esto significa que para su caso, casi todas sus interpretaciones son correctas con una excepción.

  • CondiciónB - cuál es la diferencia en la intercepción para la condición B con respecto a la condición A, cuando X es cero .

Por lo tanto, si el cero carece de significado para su variable (por ejemplo, es la edad y sólo observa a los participantes adultos) su estimación de la Condición (que ahora es un simple efecto de la condición en X = 0) también carece de significado.

En general, tener interacciones con covariables continuas no es trivial y hay al menos dos libros y varios artículos que discuten ampliamente esta cuestión. Una solución común es centrar la covariable en la media. Que esto tenga o no sentido depende de su covariable. Lo que yo hago a veces cuando tengo una variable con un rango restringido (por ejemplo, va de 0 a 100) es centrarla en el punto medio de la escala (véase por ejemplo aquí ).

Puede encontrar más información sobre el centrado en las siguientes referencias. Le recomiendo que lea al menos la primera:

También hay alguna discusión específica de modelos mixtos sobre el centrado, pero a mí me parece que esto es principalmente relevante para las estructuras jerárquicas (es decir, al menos dos niveles de anidación), por ejemplo,

  • Wang, L., & Maxwell, S. E. (2015). Sobre la desagregación de los efectos entre personas y dentro de las personas con datos longitudinales utilizando modelos multinivel. Psychological Methods, 20(1), 63-83. https://doi.org/10.1037/met0000030

Potencialmente también relevante:

  • Iacobucci, D., Schneider, M. J., Popovich, D. L., & Bakamitsos, G. A. (2016). El centrado de la media ayuda a aliviar la multicolinealidad "micro" pero no "macro". Behavior Research Methods, 48(4), 1308-1317. https://doi.org/10.3758/s13428-015-0624-x

1 votos

+1, me alegro de que respondas a esto tan rápidamente. Excelente punto sobre si X=0 es una línea de base significativa. De hecho, pensando en lo que es un una línea de base significativa es, en mi opinión, la forma correcta de enfocar los contrastes. A veces puede ser la media general, a veces puede ser un nivel concreto (o un valor concreto en el caso de un predictor continuo), por lo que no hay una elección de contrastes que sea siempre "la más interpretable"...

1 votos

Por cierto, me parece que esta parte de tu capítulo da por sentado que el lector sabe lo que es el "efecto principal" y el "efecto simple". Yo no lo sabía (o mejor dicho, no estaba muy seguro) así que lo busqué en Google, y después de ver las definiciones, tu texto quedó muy claro. Tal vez una nota a pie de página o una frase que los defina más explícitamente podría ser útil.

0 votos

Henrik, gracias por una explicación tan detallada, y por la aclaración. Te sugiero que también edites tu respuesta para incluir la presentación que fue añadida por @amoeba ( lrdc.pitt.edu/maplelab/slides/Simple_Main_Effects_Fraundorf.pdf ) porque ofrece una explicación muy sencilla y rápida de la codificación de maniquíes y efectos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X