40 votos

¿Cómo interpreto las "correlaciones de los efectos fijos" en el resultado de mi glmer?

Tengo la siguiente salida:

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

Todas mis variables continuas (denotadas por un pequeño s antes del nombre de la variable) están estandarizados (puntuaciones z). season es una variable categórica con 2 niveles (temprano y tardío), y crop es una variable categórica con 3 niveles (maíz, forraje y soja).

Esta correlación de la matriz de efectos fijos me confunde mucho, porque todas las correlaciones tienen el signo contrario al que tienen cuando miro las regresiones simples de pares de variables, es decir, la correlación de la matriz de efectos fijos sugiere una fuerte correlación positiva entre cropforage y sbare cuando en realidad hay una correlación NEGATIVA muy fuerte entre estas variables - los cultivos forrajeros tendieron a tener mucho menos suelo desnudo en comparación con los cultivos de maíz y soja. Los pares de variables continuas tienen el mismo problema, la correlación de la matriz de efectos fijos dice que todo es lo contrario de lo que debería ser ... ¿Podría deberse a la complejidad del modelo (al no ser una simple regresión)? ¿Podría tener algo que ver con el hecho de que las variables estén estandarizadas?

Gracias.

40voto

BBlake Puntos 310

El resultado de la "correlación de efectos fijos" no tiene el significado intuitivo que la mayoría le atribuiría. En concreto, no se trata de la correlación de las variables (como señala OP). En realidad, se trata de la correlación esperada de los coeficientes de regresión. Aunque esto puede hablar de multicolinealidad, no lo hace necesariamente. En este caso te está diciendo que si haces el experimento de nuevo y resulta que el coeficiente de cropforage es probable que también lo sea el coeficiente de sbare .

En parte, su libro "Analyzing Linguistic Data: A Practical Introduction to Statistics using R " que trata de lme4 Baayen suprime esa parte de la salida y la declara útil sólo en casos especiales. Aquí es un mensaje de listserv en el que el propio Bates describe cómo interpretar esa parte del resultado:

Es una correlación aproximada del estimador del fijo efectos fijos. (Incluyo la palabra "aproximada" porque debería pero en este caso la aproximación es muy buena). No estoy seguro de cómo explicarlo mejor. Supongamos que se toma una muestra MCMC de los parámetros del modelo, entonces esperarías que la muestra de los parámetros de efectos fijos mostrara una estructura de correlación como esta matriz.

2voto

SemperPeritus Puntos 101

Puede ser útil mostrar que esas correlaciones entre efectos fijos se obtienen convirtiendo el "vcov" del modelo en una matriz de correlaciones. Si fit es su modelo lme4 ajustado, entonces

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

y las correlaciones entre los efectos fijos son las entradas no diagonales.

1voto

Dave Puntos 6

Si tus correlaciones negativas y positivas son iguales en su valor y sólo difieren en su signo, estás introduciendo la variable erróneamente. Pero no creo que este sea tu caso ya que pareces bastante avanzado en estadística.

La incoherencia que está experimentando puede ser y es probablemente causada por la multicolinealidad. Esto significa que cuando algunos independiente variables comparten algunos efectos superpuestos, o en otras palabras son correlacionado Por ejemplo, la modelización de las variables "tasa de crecimiento" y "tamaño del tumor" puede causar multicolinealidad, ya que es posible y probable que los tumores más grandes tengan tasas de crecimiento más altas (antes de ser detectados). Esto puede confundir el modelo. Y si el modelo tiene pocas variables independientes que estén correlacionadas entre sí, la interpretación de los resultados puede resultar a veces bastante difícil. A veces da lugar a coeficientes totalmente extraños, incluso hasta tal punto que el signo de algunas de las correlaciones se invierte.

En primer lugar, debe detectar las fuentes de multicolinealidad y ocuparse de ellas, para luego volver a realizar el análisis.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X