Utilice GEE cuando esté interesado en descubrir el efecto medio de la población de una covariable frente al efecto específico del individuo. Estas dos cosas sólo son equivalentes en los modelos lineales, pero no en los no lineales (por ejemplo, los logísticos). Para ver esto, tomemos, por ejemplo, el modelo logístico de efectos aleatorios del $j$ La observación de la $i$ 'el tema, $Y_{ij}$ ;
$$ \log \left( \frac{p_{ij}}{1-p_{ij}} \right) = \mu + \eta_{i} $$
donde $\eta_{i} \sim N(0,\sigma^{2})$ es un efecto aleatorio para el sujeto $i$ y $p_{ij} = P(Y_{ij} = 1|\eta_{i})$ .
Si se utilizara un modelo de efectos aleatorios con estos datos, se obtendría una estimación de $\mu$ que tiene en cuenta el hecho de que se aplicó a cada individuo una perturbación de media cero normalmente distribuida, lo que la hace específica para cada individuo.
Si se utiliza GEE en estos datos, se estimarían las probabilidades logarítmicas promedio de la población. En este caso sería
$$ \nu = \log \left( \frac{ E_{\eta} \left( \frac{1}{1 + e^{-\mu-\eta_{i}}} \right)}{ 1-E_{\eta} \left( \frac{1}{1 + e^{-\mu-\eta_{i}}} \right)} \right) $$
$\nu \neq \mu$ En general. Por ejemplo, si $\mu = 1$ y $\sigma^{2} = 1$ entonces $\nu \approx .83$ . Aunque los efectos aleatorios tienen media cero en la transformada (o vinculado ), su efecto no es medio cero en la escala original de los datos. Intente simular algunos datos de un modelo de regresión logística de efectos mixtos y compare la media del nivel de población con el logaritmo inverso del intercepto y verá que no son iguales, como en este ejemplo. Esta diferencia en la interpretación de los coeficientes es la diferencia fundamental entre los modelos GEE y los de efectos aleatorios .
Editar: En general, un modelo de efectos mixtos sin predictores puede escribirse como
$$ \psi \big( E(Y_{ij}|\eta_{i}) \big) = \mu + \eta_{i} $$
donde $\psi$ es una función de enlace. Siempre que
$$ \psi \Big( E_{\eta} \Big( \psi^{-1} \big( E(Y_{ij}|\eta_{i}) \big) \Big) \Big) \neq E_{\eta} \big( E(Y_{ij}|\eta_{i}) \big) $$
habrá una diferencia entre los coeficientes medios de la población (GEE) y los coeficientes específicos del individuo (modelos de efectos aleatorios). Es decir, los promedios cambian al transformar los datos, integrar los efectos aleatorios en la escala transformada y volver a transformarlos. Obsérvese que en el modelo lineal, (es decir, $\psi(x) = x$ ), la igualdad se mantiene, por lo que son equivalentes.
Editar 2: También cabe destacar que los errores estándar "robustos" de tipo sándwich producidos por un modelo GEE proporcionan intervalos de confianza asintóticos válidos (por ejemplo, cubren realmente el 95% del tiempo) incluso si la estructura de correlación especificada en el modelo no es correcta.
Edita 3: Si su interés es entender la estructura de asociación en los datos, las estimaciones GEE de las asociaciones son notoriamente ineficientes (y a veces inconsistentes). He visto una referencia para esto pero no puedo ubicarla ahora mismo.