9 votos

¿Por qué la codificación del tratamiento da lugar a una correlación entre la pendiente y el intercepto aleatorios?

Considere un diseño factorial dentro de un sujeto y dentro de un elemento en el que la variable de tratamiento experimental tiene dos niveles (condiciones). Sea m1 sea el modelo máximo y m2 el modelo de correlaciones no aleatorias.

m1: y ~ condition + (condition|subject) + (condition|item)
m2: y ~ condition + (1|subject) + (0 + condition|subject) + (1|item) + (0 + condition|item)

Dale Barr afirma lo siguiente para esta situación:
Edición (20/4/2018): Como ha señalado Jake Westfall, las siguientes afirmaciones parecen referirse a los conjuntos de datos que se muestran en la Fig. 1 y 2 en este sólo en el sitio web. Sin embargo, la nota clave sigue siendo la misma.

En una representación de codificación de la desviación (condición: -0,5 frente a 0,5) m2 permite distribuciones, donde los interceptos aleatorios del sujeto no están correlacionados con las pendientes aleatorias del sujeto. Sólo un modelo máximo m1 permite las distribuciones, en las que ambas están correlacionadas.

En la representación de la codificación del tratamiento (condición: 0 frente a 1), estas distribuciones, en las que los interceptos aleatorios de los sujetos no están correlacionados con las pendientes aleatorias de los sujetos, no pueden ajustarse utilizando el modelo sin correlaciones aleatorias, ya que en cada caso existe una correlación entre la pendiente y el intercepto aleatorios en la representación de la codificación del tratamiento.

¿Por qué la codificación del tratamiento siempre ¿resultan en una correlación entre la pendiente y el intercepto aleatorios?

27voto

Jake Westfall Puntos 3777

La codificación del tratamiento no siempre o necesariamente resultar en una correlación intercepto/pendiente, pero tiende a hacerlo más a menudo que no. Es más fácil ver por qué esto es así utilizando imágenes, y considerando el caso de un predictor continuo en lugar de categórico.

Aquí hay una imagen de un conjunto de datos agrupados de aspecto normal con aproximadamente 0 correlación entre los interceptos aleatorios y las pendientes aleatorias: enter image description here

Pero ahora mira lo que ocurre cuando se desplaza el predictor X muy a la derecha añadiendo 3 a cada valor de X: enter image description here

Es el mismo conjunto de datos en un sentido profundo -- si ampliamos los puntos de datos, se vería idéntico al primer gráfico, pero con el eje X reetiquetado -- pero simplemente desplazando X hemos inducido una correlación negativa casi perfecta entre los interceptos aleatorios y las pendientes aleatorias. Esto sucede porque cuando desplazamos X, redefinimos los interceptos de cada grupo. Recuerde que los interceptos siempre se refieren a los valores Y donde las líneas de regresión específicas de cada grupo cruzan X=0. Pero ahora el punto X=0 está muy lejos del centro de los datos. Así que estamos extrapolando esencialmente fuera del rango de los datos observados para calcular los interceptos. El resultado, como puede ver, es que cuanto mayor es la pendiente, menor es el intercepto, y viceversa.

Cuando se utiliza la codificación del tratamiento, es como hacer una versión menos extrema del desplazamiento en X representado en el gráfico inferior. Esto se debe a que los códigos de tratamiento {0,1} son sólo una versión desplazada de los códigos de desviación {-0,5, 0,5}, a los que se ha añadido un desplazamiento de +0,5. Edición 2018-08-29: esto se ilustra ahora de forma más clara y directa en la segunda figura de esta respuesta mía más reciente a otra pregunta .

Como dije antes, esto no es cierto por necesidad . Es posible tener un conjunto de datos similar al anterior, pero en el que las pendientes y los interceptos no estén correlacionados en la escala desplazada (donde los interceptos se refieren a puntos alejados de los datos) y estén correlacionados en la escala centrada. Pero las líneas de regresión específicas del grupo en tales conjuntos de datos tenderán a mostrar patrones de "abanico" que, en la práctica, no son tan comunes en el mundo real.

-1voto

Loren Pechtel Puntos 2212

Creo que se debe a que cualquier cosa multiplicada por cero es cero, así que si se observan las cuatro posibles interacciones (multiplicaciones) de 0 y 1, tres de las cuatro son cero. Por otro lado, dos de las cuatro interacciones de -1 y 1 son 1 y dos son -1.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X