Tenemos puntos de datos de un estudio prospectivo en el que los participantes fueron evaluados 3 veces durante el seguimiento para una exposición de interés, y durante un 4º seguimiento fueron evaluados para un resultado de interés. Todas las medidas están codificadas de forma continua. Creemos que hay un mecanismo algo complicado subyacente a la posible asociación, sin embargo, en este punto del análisis, tenemos curiosidad por saber si hay algún tipo de asociación marginal en la que la exposición "más temprana" se asocie con el resultado "más tardío", este lenguaje es clave para no asumir que tienen asociaciones coincidentes.
De este modo, podríamos examinar cualquier análisis en el que la exposición de referencia se revierta contra el seguimiento, o la exposición más reciente se revierta contra el seguimiento. La exposición que hemos evaluado es una medida imperfecta y existe una importante correlación intraclase. Por lo tanto, sería bueno utilizar un enfoque de modelado que pueda llegar a una media estimada de la exposición.
El enfoque analítico actual consiste en fusionar el resultado con las tres evaluaciones de la exposición en un conjunto de datos largo y utilizar un GEE ajustado a la edad para tener en cuenta las medidas repetidas. Sin embargo, estamos interesados en la inferencia sobre la asociación a nivel de grupo. Por lo tanto, un GEE con un enlace lineal es apto para estimar una tendencia de primer orden.
¿Da el GEE una inferencia apropiada sobre este resultado o debemos ir marginando las estimaciones de alguna forma?
De alguna manera, me preocupa que estemos inflando artificialmente el tamaño de la muestra, ya que es el mismo enfoque analítico que se utilizaría si el resultado se evaluara tres veces distintas. Sin embargo, dado que es el el mismo resultado, creo que la correlación entre estas observaciones debería ser mayor y, por lo tanto, el modelo de regresión debería "rebajar" las observaciones intracluster altamente correlacionadas.