Soy un epidemiólogo que intenta comprender los GEE para analizar correctamente un estudio de cohortes (utilizando la regresión de Poisson con un enlace logarítmico, para estimar el riesgo relativo). Tengo algunas preguntas sobre la "correlación de trabajo" que me gustaría que alguien con más conocimientos me aclarara:
(1) Si tengo mediciones repetidas en el mismo individuo, ¿suele ser más razonable suponer una estructura intercambiable? (¿O una autorregresiva si las mediciones muestran una tendencia)? ¿Qué ocurre con la independencia? ¿Existe algún caso en el que se pueda suponer la independencia de las mediciones en el mismo individuo?
(2) ¿Existe alguna forma (razonablemente sencilla) de evaluar la estructura adecuada examinando los datos?
(3) He observado que, al elegir una estructura de independencia, obtengo las mismas estimaciones puntuales (pero errores estándar más bajos) que al ejecutar una regresión de Poisson simple (utilizando R, función glm()
y geeglm()
del paquete geepack
). ¿Por qué ocurre esto? Entiendo que con los GEE se estima un modelo promediado de población (en contraste con el específico de un sujeto), por lo que se deberían obtener las mismas estimaciones puntuales sólo en el caso de la regresión lineal.
(4) Si mi cohorte se encuentra en varios lugares (pero una medición por individuo), ¿debo elegir una correlación de trabajo independiente o intercambiable, y por qué? Es decir, los individuos de cada sitio siguen siendo independientes entre sí, ¿no? Así, para un modelo específico para un sujeto, por ejemplo, especificaría el sitio como un efecto aleatorio. Sin embargo, con GEE, independencia e intercambiable dan estimaciones diferentes y no estoy seguro de cuál es mejor en términos de supuestos subyacentes.
(5) ¿Puede GEE manejar una agrupación jerárquica de 2 niveles, es decir, una cohorte multisitio con medidas repetidas por individuo? En caso afirmativo, ¿qué debo especificar como variable de agrupación en geeglm()
y ¿cuál debería ser la correlación de trabajo si se supone, por ejemplo, "independencia" para el primer nivel (sitio) e "intercambiable" o "autorregresiva" para el segundo nivel (individuo)?
Entiendo que son bastantes preguntas, y algunas de ellas pueden ser bastante básicas, pero aún así muy difíciles de entender para mí (¿y quizás para otros novatos?). Por lo tanto, cualquier ayuda es muy apreciada y sinceramente, y para mostrar esto he comenzado una recompensa.