85 votos

¿Cuándo utilizar ecuaciones de estimación generalizadas frente a modelos de efectos mixtos?

Llevo un tiempo utilizando con bastante gusto modelos de efectos mixtos con datos longitudinales. Me gustaría poder ajustar las relaciones AR en lmer (¿creo que tengo razón en que no puedo hacerlo?) pero no creo que sea desesperadamente importante así que no me preocupo demasiado.

Acabo de encontrarme con las ecuaciones de estimación generalizada (GEE), y parece que ofrecen mucha más flexibilidad que los modelos ME.

A riesgo de hacer una pregunta demasiado general, ¿hay algún consejo sobre cuál es mejor para las diferentes tareas? He visto algunos trabajos que los comparan, y suelen ser de la forma

"En este ámbito tan especializado, no uses GEEs para X, no uses modelos ME para Y".

No he encontrado más consejos generales. ¿Puede alguien iluminarme?

Gracias.

72voto

Niall Puntos 51

Utilice GEE cuando esté interesado en descubrir el efecto medio de la población de una covariable frente al efecto específico del individuo. Estas dos cosas sólo son equivalentes en los modelos lineales, pero no en los no lineales (por ejemplo, los logísticos). Para ver esto, tomemos, por ejemplo, el modelo logístico de efectos aleatorios del $j$ La observación de la $i$ 'el tema, $Y_{ij}$ ;

$$ \log \left( \frac{p_{ij}}{1-p_{ij}} \right) = \mu + \eta_{i} $$

donde $\eta_{i} \sim N(0,\sigma^{2})$ es un efecto aleatorio para el sujeto $i$ y $p_{ij} = P(Y_{ij} = 1|\eta_{i})$ .

Si se utilizara un modelo de efectos aleatorios con estos datos, se obtendría una estimación de $\mu$ que tiene en cuenta el hecho de que se aplicó a cada individuo una perturbación de media cero normalmente distribuida, lo que la hace específica para cada individuo.

Si se utiliza GEE en estos datos, se estimarían las probabilidades logarítmicas promedio de la población. En este caso sería

$$ \nu = \log \left( \frac{ E_{\eta} \left( \frac{1}{1 + e^{-\mu-\eta_{i}}} \right)}{ 1-E_{\eta} \left( \frac{1}{1 + e^{-\mu-\eta_{i}}} \right)} \right) $$

$\nu \neq \mu$ En general. Por ejemplo, si $\mu = 1$ y $\sigma^{2} = 1$ entonces $\nu \approx .83$ . Aunque los efectos aleatorios tienen media cero en la transformada (o vinculado ), su efecto no es medio cero en la escala original de los datos. Intente simular algunos datos de un modelo de regresión logística de efectos mixtos y compare la media del nivel de población con el logaritmo inverso del intercepto y verá que no son iguales, como en este ejemplo. Esta diferencia en la interpretación de los coeficientes es la diferencia fundamental entre los modelos GEE y los de efectos aleatorios .

Editar: En general, un modelo de efectos mixtos sin predictores puede escribirse como

$$ \psi \big( E(Y_{ij}|\eta_{i}) \big) = \mu + \eta_{i} $$

donde $\psi$ es una función de enlace. Siempre que

$$ \psi \Big( E_{\eta} \Big( \psi^{-1} \big( E(Y_{ij}|\eta_{i}) \big) \Big) \Big) \neq E_{\eta} \big( E(Y_{ij}|\eta_{i}) \big) $$

habrá una diferencia entre los coeficientes medios de la población (GEE) y los coeficientes específicos del individuo (modelos de efectos aleatorios). Es decir, los promedios cambian al transformar los datos, integrar los efectos aleatorios en la escala transformada y volver a transformarlos. Obsérvese que en el modelo lineal, (es decir, $\psi(x) = x$ ), la igualdad se mantiene, por lo que son equivalentes.

Editar 2: También cabe destacar que los errores estándar "robustos" de tipo sándwich producidos por un modelo GEE proporcionan intervalos de confianza asintóticos válidos (por ejemplo, cubren realmente el 95% del tiempo) incluso si la estructura de correlación especificada en el modelo no es correcta.

Edita 3: Si su interés es entender la estructura de asociación en los datos, las estimaciones GEE de las asociaciones son notoriamente ineficientes (y a veces inconsistentes). He visto una referencia para esto pero no puedo ubicarla ahora mismo.

19voto

dan90266 Puntos 609

En mi opinión, la GEE es más útil cuando no se utiliza la modelización bayesiana y cuando no se dispone de una solución de probabilidad completa. Además, la GEE puede requerir tamaños de muestra más grandes para ser lo suficientemente precisa, y es muy poco robusta para los datos longitudinales que faltan de forma no aleatoria. La GEE asume que los datos faltan completamente al azar, mientras que los métodos de verosimilitud (modelos de efectos mixtos o mínimos cuadrados generalizados, por ejemplo) asumen que sólo faltan al azar.

3voto

bessman Puntos 2514

Puede encontrar un debate exhaustivo y ejemplos concretos en Fitzmaurice, Laird y Ware, Análisis longitudinal aplicado John Wiley & Sons, 2011, 2ª edición, capítulos 11-16.

En cuanto a los ejemplos, puede encontrar conjuntos de datos y programas SAS/Stata/R en el sitio web complementario .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X