19 votos

Interpretar tres formas de un "modelo mixto"

Hay una distinción que me está confundiendo con los modelos mixtos, y me pregunto si podría obtener algo de claridad al respecto. Supongamos que tienes un modelo mixto de datos de conteo. Hay una variable que sabes que quieres como efecto fijo (A) y otra variable para el tiempo (T), agrupadas por ejemplo por una variable "Sitio".

Según tengo entendido:

glmer(counts ~ A + T, data=data, family="Poisson") es un modelo de efectos fijos.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") es un modelo de efectos aleatorios.

Mi pregunta es cuando tienes algo como:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson") ¿qué es T? ¿Es un efecto aleatorio? ¿Un efecto fijo? ¿Qué se consigue realmente poniendo T en ambos lugares?

¿Cuándo debe algo sólo en la sección de efectos aleatorios de la fórmula del modelo?

22voto

Niall Puntos 51

Esto puede quedar más claro escribiendo la fórmula del modelo para cada uno de estos tres modelos. Sea $Y_{ij}$ sea la observación para la persona $i$ en el sitio $j$ en cada modelo y definir $A_{ij}, T_{ij}$ de forma análoga para referirse a las variables de su modelo.

glmer(counts ~ A + T, data=data, family="Poisson") es el modelo

$$ \log \big( E(Y_{ij}) \big) = \beta_0 + \beta_1 A_{ij} + \beta_2 T_{ij} $$

que no es más que un modelo ordinario de regresión de Poisson.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") es el modelo

$$ \log \big( E(Y_{ij}) \big) = \alpha_0 + \eta_{j0} + \eta_{j1} A_{ij} + \eta_{j2} T_{ij} $$

donde $\eta_{j} = (\eta_{j0}, \eta_{j1}, \eta_{j2}) \sim N(0, \Sigma)$ son efectos aleatorios compartidos por cada observación realizada por los individuos del sitio $j$ . Se permite que estos efectos aleatorios estén libremente correlacionados (es decir, no se impone ninguna restricción sobre $\Sigma$ ) en el modelo especificado. Para imponer la independencia, debe colocarlos dentro de paréntesis diferentes, por ejemplo (A-1|Site) + (T-1|Site) + (1|Site) lo haría. Este modelo supone que $\log \big( E(Y_{ij}) \big)$ es $\alpha_0$ para todos los sitios, pero cada sitio tiene un desplazamiento aleatorio ( $\eta_{j0}$ ) y tiene una relación lineal aleatoria tanto con $A_{ij}, T_{ij}$ .

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") es el modelo

$$ \log \big( E(Y_{ij}) \big) = (\theta_0 + \gamma_{j0}) + \theta_1 A_{ij} + (\theta_2 + \gamma_{j1}) T_{ij} $$

Así que ahora $\log \big( E(Y_{ij}) \big)$ tiene alguna relación "media" con $A_{ij}, T_{ij}$ dados por los efectos fijos $\theta_0, \theta_1, \theta_2$ pero esa relación es diferente para cada sitio y esas diferencias son capturadas por los efectos aleatorios, $\gamma_{j0}, \gamma_{j1}, \gamma_{j2}$ . Es decir, la línea de base se desplaza aleatoriamente y las pendientes de las dos variables se desplazan aleatoriamente y todas las personas del mismo sitio comparten el mismo desplazamiento aleatorio.

¿qué es T? ¿Es un efecto aleatorio? ¿Un efecto fijo? ¿Qué se consigue realmente poniendo T en ambos lugares?

$T$ es una de sus covariables. No es un efecto aleatorio - Site es un efecto aleatorio. Hay un efecto fijo de $T$ que es diferente en función del efecto aleatorio conferido por Site - $\gamma_{j1}$ en el modelo anterior. Lo que se consigue incluyendo este efecto aleatorio es tener en cuenta la heterogeneidad entre lugares en la relación entre $T$ y $\log \big( E(Y_{ij}) \big)$ .

¿Cuándo debe aparecer algo sólo en la sección de efectos aleatorios de la fórmula del modelo?

Es una cuestión de lo que tiene sentido en el contexto de la aplicación.

En cuanto al intercepto, debe mantener el intercepto fijo por muchas razones (véase, por ejemplo, aquí ); re: el intercepto aleatorio, $\gamma_{j0}$ Esto sirve principalmente para inducir la correlación entre las observaciones realizadas en el mismo lugar. Si no tiene sentido que exista tal correlación, entonces debe excluirse el efecto aleatorio.

En cuanto a las pendientes aleatorias, un modelo con sólo pendientes aleatorias y sin pendientes fijas refleja la creencia de que, para cada sitio, existe alguna relación entre $\log \big( E(Y_{ij}) \big)$ y sus covariables para cada sitio, pero si usted promedia esos efectos sobre todos los sitios, entonces no hay relación. Por ejemplo, si tuviéramos una pendiente aleatoria en $T$ pero sin pendiente fija, esto sería como decir que el tiempo, por término medio, no tiene ningún efecto (por ejemplo, no hay tendencias seculares en los datos) pero cada Site se dirige en una dirección aleatoria en el tiempo, lo que podría tener sentido. De nuevo, depende de la aplicación.

Tenga en cuenta que puede ajustar el modelo con y sin efectos aleatorios para ver si esto está ocurriendo - no debería ver ningún efecto en el modelo fijo pero sí efectos aleatorios significativos en el modelo posterior. Debo advertirle de que este tipo de decisiones suelen tomarse mejor basándose en la comprensión de la aplicación que en la selección del modelo.

11voto

Anthony Cramp Puntos 126

Tenga en cuenta que T no es ninguno de los términos de efectos aleatorios de su modelo, sino un efecto fijo. Los efectos aleatorios son sólo los efectos que aparecen después de la | en un lmer ¡Fórmula!

Encontrará un análisis más detallado de esta especificación en este enlace lmer faq pregunta .

A partir de estas preguntas su modelo debería dar lo siguiente (para su efecto fijo T ):

  • Una pendiente global
  • Un término de pendientes aleatorias que especifica la desviación de la pendiente general para cada nivel de Site
  • La correlación entre las pendientes aleatorias.

Y como ha dicho @mark999 se trata efectivamente de una especificación común. En los diseños de medidas repetidas, generalmente se desea tener pendientes y correlaciones aleatorias para todos los factores de medidas repetidas (dentro de los sujetos).

Véase el siguiente artículo para algunos ejemplos (que suelo citar siempre aquí):

Judd, C. M., Westfall, J., & Kenny, D. A. (2012). El tratamiento de los estímulos como un factor aleatorio en la psicología social: Una solución nueva y completa a un problema omnipresente pero en gran medida ignorado. Revista de Personalidad y Psicología Social , 103(1), 54-69. doi:10.1037/a0028347

1voto

Zizzencs Puntos 1358

Algo debería aparecer sólo en la parte aleatoria cuando no esté especialmente interesado en su parámetro, per se, pero necesite incluirlo para evitar datos dependientes. Por ejemplo, si los hijos están anidados en clases, normalmente sólo querrá los hijos como efecto aleatorio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X