La cita en bloque que figura a continuación, de líderes en el campo de la modelización de efectos mixtos, afirma que los cambios de coordenadas en modelos con correlación cero entre efectos aleatorios ("modelos ZCP") modifican las predicciones del modelo. Pero, ¿puede alguien explicar o justificar mejor sus afirmaciones?
Las declaraciones en cuestión proceden de Bates et al's Documento de 2015 sobre lme4
, Ajuste de modelos lineales de efectos mixtos con lme4 página 7, segundo párrafo ( enlace de descarga ). $\newcommand{\slope}{\text{slope}} \newcommand{\int}{\text{int}} \newcommand{\intercept}{\text{intercept}}$
He aquí una paráfrasis de lo que escribieron:
Aunque los modelos de parámetro de correlación cero se utilizan para reducir la complejidad de los modelos de pendientes aleatorias, tienen un inconveniente. Los modelos en los que se permite que las pendientes y los interceptos tengan una correlación distinta de cero son invariables a los desplazamientos aditivos de un predictor continuo.
Esta invariabilidad se rompe cuando la correlación se limita a cero; cualquier cambio en el predictor provocará necesariamente un cambio en la correlación estimada, y en la probabilidad y las predicciones del modelo. 1 Por ejemplo, podemos eliminar la correlación en fm1 simplemente desplazando Días [el predictor que acompaña $\slope$ en una cantidad igual al cociente de las desviaciones estándar estimadas entre sujetos multiplicado por la correlación estimada, es decir. 2 ,
$$\rho_{\slope:\intercept}\times\frac{\sigma_{\slope}}{\sigma_{\intercept}}$$
Idealmente, el uso de estos modelos debería limitarse a los casos en los que el predictor se mide en una escala de relación (es decir, el punto cero de la escala es significativo, no sólo un lugar definido por conveniencia o convención).
Preguntas:
Numerados de acuerdo con los superíndices anteriores...
-
Veo que cualquier cambio en el sistema de coordenadas por el que se mide el predictor provocará un cambio en la correlación estimada, lo que dará lugar a una correlación distinta de cero. Esto apoya la afirmación de que los modelos de parámetro de correlación cero no son invariables bajo cambios en los sistemas de coordenadas del predictor, y por lo tanto que cualquier modelo con correlaciones de efectos aleatorios distintas de cero puede transformarse en un modelo con correlaciones cero mediante un cambio adecuado en las coordenadas. Creo que también respalda el tercer párrafo de la paráfrasis anterior: Los modelos ZCP (y los modelos de intercepción cero - véase más adelante; pero por favor, compruébeme esto ) sólo son válidos para modelos que utilicen determinados sistemas de coordenadas especiales. Pero, ¿por qué un desplazamiento de coordenadas debería cambiar las predicciones de estos modelos?
Por ejemplo, un cambio en las coordenadas también cambiará el término de intercepción del efecto fijo para los promedios de grupo (véase más adelante), pero sólo en una cantidad adecuada al cambio en el origen del sistema de coordenadas del predictor. Este cambio no afecta a las predicciones del modelo, siempre que se utilice el nuevo sistema de coordenadas para el predictor desplazado.
Para explicarlo mejor, si la pendiente del efecto fijo asociada con el predictor desplazado es positiva, y el origen del sistema de coordenadas del predictor se desplaza en dirección negativa, entonces el intercepto del efecto fijo disminuirá, y cualquier intercepto de efecto aleatorio asociado también cambiará en consecuencia, reflejando la nueva definición de "origen" (y por tanto de intercepto) en el sistema de coordenadas desplazado. Por cierto, creo que este razonamiento también implica que un modelo de intercepción cero tampoco es invariable bajo tales cambios.
-
Creo que tengo una manera razonable de resolver esto, pero he obtenido una respuesta ligeramente diferente a Bates et al. ¿Me estoy equivocando?
He aquí mi respuesta. A continuación está la descripción de cómo llegué a mi resultado. En resumen, encuentro que si desplazo el $x$ origen negativamente por $\delta > 0$ para que en el nuevo sistema de coordenadas el predictor tome los valores $x' = x + \delta$ entonces la correlación $\rho'$ en el nuevo sistema de coordenadas es cero si:
$$\delta=\rho_{\slope:\intercept}\times\frac{\sigma_{\intercept}}{\sigma_{\slope}}$$
Esto difiere de Bates et al's resultado.
Descripción de mi método (Lectura optativa) : Supongamos que tenemos la correlación de dos efectos aleatorios, $\slope$ y $\intercept$ ( $\int$ para abreviar), correspondiendo ambos al mismo factor de agrupación con $k$ niveles (numerados por $i$ que van desde $1$ a $k$ ). Digamos también que el predictor continuo con el que el azar $\slope$ está emparejado se denomina $x$ definido de forma que el producto $x\times\slope_i$ genera la contribución condicional al valor ajustado $\hat y_{obs}$ para el nivel $i$ del factor de agrupación asociado. Aunque en realidad el algoritmo MLE determina el valor de $\rho$ para maximizar la probabilidad Si el efecto de la traslación es uniforme, la expresión siguiente debería ser una forma dimensionalmente correcta de determinar los efectos de una traslación uniforme en $x$ el multiplicador del efecto aleatorio para $\slope$ .
$$\rho_{\slope:\int} = \frac{E_{i}\big[(\slope_i -\overline {\slope_i})(\int_i -\overline {\int_i})\big]}{\sqrt{E_{i}\big[(\slope_i -\overline {\slope_i})^2\big]E_{i}\big[(\int_i-\overline {\int_i})^2\big]}}$$
Para llegar a mi resultado, primero reescribí el antiguo valor para el intercepto en términos de un nuevo valor para el intercepto, $\int' = -\delta \times \slope + \int$ (aquí, $\delta > 0$ el desplazamiento "hacia la izquierda" del origen del predictor $x$ ). A continuación, he sustituido la expresión resultante en el numerador de la fórmula anterior para $\rho$ calculando el valor de $\delta$ que resultó en una covarianza cero en el nuevo sistema de coordenadas. Obsérvese que, como se indica en Pregunta 1 anterior, el término de intercepción de efecto fijo también cambiará de forma análoga: $\beta_0' =- \delta\times\beta_x + \beta_0$ . (Aquí, $\beta_x$ es el predictor de efecto fijo asociado al predictor desplazado $x.$ )