6 votos

¿Cómo dividir la varianza explicada a nivel de grupo y a nivel individual?

Basándose en los resultados del modelo nulo, algunos estudiosos sugieren que la varianza atribuida al nivel de grupo y al nivel individual se calcule utilizando la salida del componente de varianza, mientras que otros sugieren utilizar las puntuaciones de la desviación estándar.

¿Existe consenso sobre cómo calcular el ICC?

2 votos

Bienvenido al sitio. ¿Podría aclarar un poco su pregunta? ¿Qué recomiendan exactamente los distintos autores? (Las fórmulas ayudarían, las referencias ayudarían, las citas ayudarían).

2 votos

Hola Peter, Gelman y Hill (p. 448) sugieren utilizar la desviación típica para calcular el ICC; fórmula desviación típica del intercepto/(desviación típica del intercepto+desviación típica del residuo). Mientras que otros, por ejemplo iub.edu/~statmath/stat/all/hlm/hlm.pdf sugerir estimaciones de la varianza; fórmula (estimación var. del intercepto/(estimación var. del intercepto+ estimación var. del residuo))

0 votos

Y si sigo la fórmula de Bliese (p. 43) hrs.mod<-aov(HRS~as.factor(GRP),data=bhr2000) obtengo una respuesta diferente cran.r-project.org/doc/contrib/Bliese_Multilevel.pdf

17voto

Jake Westfall Puntos 3777

Sí, hay consenso: se debe utilizar el desviaciones , no las desviaciones estándar, al calcular la correlación intraclase (CCI).

El modelo de sólo intercepto aleatorio de dos niveles es $$ y_{ij} = \beta_0 + u_{0j} + e_{ij}, $$ donde los interceptos aleatorios $u_{0j}$ tienen varianza $\sigma^2_{u_0}$ y los residuos $e_{ij}$ tienen varianza $\sigma^2_e$ .

Ahora, la correlación entre dos variables aleatorias $x$ y $y$ se define como $$ corr = \frac{cov(x, y)}{\sqrt{var(x)var(y)}}. $$

Así pues, para hallar la fórmula de la correlación intraclase, utilizamos la fórmula de correlación y dejamos que nuestras dos variables aleatorias sean dos observaciones extraídas de la misma $j$ grupo, $$ ICC = \frac{cov(\beta_0 + u_{0j} + e_{1j}, \beta_0 + u_{0j} + e_{2j})}{\sqrt{var(\beta_0 + u_{0j} + e_{1j})var(\beta_0 + u_{0j} + e_{2j})}}, $$ y si se simplifica utilizando las definiciones anteriores y las propiedades de las varianzas/covarianzas, se obtiene $$ ICC = \frac{\sigma^2_{u_0}}{\sigma^2_{u_0} + \sigma^2_e}. $$

Así pues, para el modelo de sólo intercepto aleatorio de dos niveles, la correlación intraclase viene dada por el cociente del intercepto aleatorio desviación al total desviación .

Si se utilizaran las raíces cuadradas de estas varianzas (es decir, las desviaciones estándar), entonces podría seguir siendo un resumen algo informativo de cuánta variabilidad tenemos en los distintos niveles del modelo, pero ya no podría interpretarse como un coeficiente de correlación intraclase.

Por cierto, he consultado la página de Gelman & Hill (2007) que mencionas (p. 448), y definen claramente el ICC en términos de varianzas, no desviaciones estándar. Así que creo que toda esta cuestión podría basarse en un error de lectura accidental de su capítulo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X