31 votos

Computación en la repetibilidad de los efectos de un modelo de lmer

Yo sólo vine a través de este documento, que describe cómo calcular la repetibilidad (un.k.una. la fiabilidad, un.k.una. la correlación intraclase) de una medición a través de efectos mixtos de modelado. El R código sería:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Creo que este enfoque también puede ser usada para calcular la fiabilidad de los efectos (es decir, suma el efecto de contraste de una variable con 2 niveles), como en:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Tres preguntas:

  1. Hacer los anteriores cálculos para la obtención de la estimación de la repetibilidad de un efecto de sentido?
  2. Cuando tengo varias variables cuyos repetibilidad quiero estimación, sumando a todos para el mismo ajuste (por ejemplo, lmer(dv~(iv1+iv2|unit)+iv1+iv2) parece producir una mayor repetibilidad de las estimaciones de la creación de un modelo independiente para cada efecto. Esto hace que el sentido de cómputo para mí, como la inclusión de múltiples efectos tienden a disminuir la varianza residual, pero no estoy seguro que el resultado de la repetibilidad de las estimaciones son válidas. Son ellos?
  3. El anteriormente citado documento sugiere que la probabilidad de perfiles me puede ayudar a obtener los intervalos de confianza para la repetibilidad de las estimaciones, pero por lo que puedo decir, confint(profile(fit)) sólo proporciona los intervalos para la intercepción y el efecto de las variaciones, mientras que yo iba a necesitar además el intervalo de la varianza residual para calcular el intervalo de la repetición, no?

9voto

Jake Westfall Puntos 3777

Creo que puedo responder a sus preguntas en menos, con respecto a los no ajustados a la repetibilidad de las estimaciones, es decir, la clásica intra-clase correlaciones (ICCs). Como para "ajustarse" a la repetibilidad de las estimaciones, me desnatada sobre el papel que enlaza y realmente no veo donde la fórmula que se aplica puede ser encontrado en el papel? También no es inmediatamente obvio para mí lo que el ajuste que se está haciendo, así que voy a tener que ignorar los ajustes de parte de su pregunta. No está claro que esta es una parte crítica de su pregunta de todos modos. Pero si usted piensa que es, tal vez usted puede ofrecer algunas aclaraciones sobre el ajuste.

(1.) Hacer los anteriores cálculos para la obtención de la estimación de la repetibilidad de un efecto de sentido?

Sí, la expresión que proponemos tiene sentido, pero con una pequeña modificación a su fórmula propuesta es necesario. A continuación os mostramos cómo uno podría derivar su propuesta de repetibilidad coeficiente. Espero que de esta manera se aclara el significado conceptual del coeficiente y también muestra por qué sería deseable modificar ligeramente.

Para empezar, primero vamos a echar la repetibilidad coeficiente en el primer caso y aclarar lo que significa y de donde viene. Entender esto nos ayudará a entender el más complicado segundo caso.

Al azar intercepta sólo

En este caso, el modelo mixto para la $i$respuesta th en el $j$th grupo es $$ y_{ij} = \beta_0 + u_{0j} + e_{ij}, $$ donde el azar intercepta $u_{0j}$ tiene varianza $\sigma^2_{u_0}$ y los residuos de $e_{ij}$ tiene varianza $\sigma^2_e$.

Ahora, la correlación entre dos variables aleatorias $x$ y $y$ se define como $$ corr = \frac{cov(x, y)}{\sqrt{var(x)var(y)}}. $$

La expresión de la CPI / repetibilidad coeficiente de entonces viene dejando que las dos variables aleatorias $x$ y $y$ dos observaciones extraídas de la misma $j$ grupo, $$ ICC = \frac{cov(\beta_0 + u_{0j} + e_{i_1j}, \beta_0 + u_{0j} + e_{i_2j})}{\sqrt{var(\beta_0 + u_{0j} + e_{i_1j})var(\beta_0 + u_{0j} + e_{i_2j})}}, $$ y si simplifica usando las definiciones dadas anteriormente y de las propiedades de varianzas/covarianzas (un proceso que no voy a mostrar aquí, a menos que usted o los demás preferirían que yo hice), se termina con $$ ICC = \frac{\sigma^2_{u_0}}{\sigma^2_{u_0} + \sigma^2_e}. $$ Lo que esto significa es que la CPI o "sin corregir repetibilidad coeficiente" en este caso tiene una interpretación sencilla como la esperada correlación entre un par de observaciones de la misma categoría (netos de los efectos fijos, que en este caso es sólo el gran media). El hecho de que la CPI también es interpretable como una proporción de la varianza en este caso es una coincidencia; que la interpretación no es cierto en general para la más complicada de los Cci. La interpretación como algún tipo de correlación es lo principal.

Al azar intercepta y aleatoria de pistas

Ahora para el segundo caso, primero tenemos que aclarar qué es exactamente lo que se entiende por "la fiabilidad de los efectos (es decir, suma el efecto de contraste de una variable con 2 niveles)" -- sus palabras.

Primero seguimos el modelo. El modelo mixto para la $i$respuesta th en el $j$th grupo de debajo de los $k$ - ésimo nivel de contraste-codificado predictor de $x$ es $$ y_{ijk} = \beta_0 + \beta_1x_k + u_{0j} + u_{1j}x_k + e_{ijk}, $$ donde el azar intercepta han varianza $\sigma^2_{u_0}$, el azar laderas tienen varianza $\sigma^2_{u_1}$, el azar intercepta y laderas tienen covarianza $\sigma_{u_{01}}$, y los residuos de $e_{ij}$ tiene varianza $\sigma^2_e$.

Entonces, ¿qué es la "repetibilidad de un efecto" en virtud de este modelo? Me parece un buen candidato definición es que se espera que la correlación entre dos pares de puntuaciones de diferencia calculada dentro de la misma $j$ clúster, pero a través de los diferentes pares de observaciones $i$.

De modo que el par de puntuaciones de diferencia en cuestión (recuerde que se supone que $x$ es el contraste codificados de manera que $|x_1|=|x_2|=x$): $$ y_{i_1jk_2}-y_{i_1jk_1}=(\beta_0-\beta_0)+\beta_1(x_{k_2}-x_{k_1})+(u_{0j}-u_{0j})+u_{1j}(x_{k_2}-x_{k_1})+(e_{i_1jk_2}-e_{i_1jk_1}) \\=2x\beta_1+2xu_{1j}+e_{i_1jk_2}-e_{i_1jk_1} $$ y $$ y_{i_2jk_2}-y_{i_2jk_1}=2x\beta_1+2xu_{1j}+e_{i_2jk_2}-e_{i_2jk_1}. $$

Conectar estas en la correlación de la fórmula nos da $$ ICC = \frac{cov(2x\beta_1+2xu_{1j}+e_{i_1jk_2}-e_{i_1jk_1}, 2x\beta_1+2xu_{1j}+e_{i_2jk_2}-e_{i_2jk_1})}{\sqrt{var(2x\beta_1+2xu_{1j}+e_{i_1jk_2}-e_{i_1jk_1})var(2x\beta_1+2xu_{1j}+e_{i_2jk_2}-e_{i_2jk_1})}}, $$ que simplifica hacia abajo para $$ ICC = \frac{2x^2\sigma^2_{u_1}}{2x^2\sigma^2_{u_1} + \sigma^2_e}. $$ Observe que la CPI es técnicamente una función de $x$! Sin embargo, en este caso $$ x sólo puede tomar 2 valores posibles, y el ICC es idéntico en ambos de estos valores.

Como se puede ver, esto es muy similar a la repetibilidad coeficiente que usted propone en su pregunta, la única diferencia es que el azar de la pendiente de la varianza debe ser de tamaño adecuado si la expresión debe interpretarse como un ICC o "sin corregir repetibilidad coeficiente." La expresión que escribió obras en el caso especial donde la $x$ predictor es codificado $\pm\frac{1}{\sqrt{2}}$, pero no en general.

(2.) Cuando tengo varias variables cuyos repetibilidad quiero estimación, sumando a todos para el mismo ajuste (por ejemplo, lmer(dv~(iv1+iv2|unit)+iv1+iv2) parece producir una mayor repetibilidad de las estimaciones de la creación de un modelo independiente para cada efecto. Esto hace que el sentido de cómputo para mí, como la inclusión de múltiples efectos tienden a disminuir la varianza residual, pero no estoy seguro que el resultado de la repetibilidad de las estimaciones son válidas. Son ellos?

Creo que trabajar a través de una similar derivación como se presentó anteriormente para un modelo con varios predictores con su propio azar laderas muestran que la repetibilidad coeficiente anterior sigue siendo válido, excepto por la complicación añadida de que la diferencia de puntuaciones se conceptualmente interesa ahora tienen una definición ligeramente diferente: es decir, estamos interesados en la espera de correlación de las diferencias entre los promedios ajustados después de controlar por el resto de los predictores en el modelo.

Si el resto de los predictores son ortogonales a la predictor de interés (como, por ejemplo, una equilibrada experimento), yo creo que la CPI / repetibilidad coeficiente elaborado anteriormente deben trabajar sin ninguna modificación. Si no son ortogonales, entonces usted tendría que modificar la fórmula para tener en cuenta de este, que podría ser más complicado, pero espero que mi respuesta ha dado algunas pistas sobre lo que podría parecer.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X