4 votos

Mediciones repetidas, exposición evaluada de forma múltiple con un único resultado

Tenemos puntos de datos de un estudio prospectivo en el que los participantes fueron evaluados 3 veces durante el seguimiento para una exposición de interés, y durante un 4º seguimiento fueron evaluados para un resultado de interés. Todas las medidas están codificadas de forma continua. Creemos que hay un mecanismo algo complicado subyacente a la posible asociación, sin embargo, en este punto del análisis, tenemos curiosidad por saber si hay algún tipo de asociación marginal en la que la exposición "más temprana" se asocie con el resultado "más tardío", este lenguaje es clave para no asumir que tienen asociaciones coincidentes.

De este modo, podríamos examinar cualquier análisis en el que la exposición de referencia se revierta contra el seguimiento, o la exposición más reciente se revierta contra el seguimiento. La exposición que hemos evaluado es una medida imperfecta y existe una importante correlación intraclase. Por lo tanto, sería bueno utilizar un enfoque de modelado que pueda llegar a una media estimada de la exposición.

El enfoque analítico actual consiste en fusionar el resultado con las tres evaluaciones de la exposición en un conjunto de datos largo y utilizar un GEE ajustado a la edad para tener en cuenta las medidas repetidas. Sin embargo, estamos interesados en la inferencia sobre la asociación a nivel de grupo. Por lo tanto, un GEE con un enlace lineal es apto para estimar una tendencia de primer orden.

¿Da el GEE una inferencia apropiada sobre este resultado o debemos ir marginando las estimaciones de alguna forma?

De alguna manera, me preocupa que estemos inflando artificialmente el tamaño de la muestra, ya que es el mismo enfoque analítico que se utilizaría si el resultado se evaluara tres veces distintas. Sin embargo, dado que es el el mismo resultado, creo que la correlación entre estas observaciones debería ser mayor y, por lo tanto, el modelo de regresión debería "rebajar" las observaciones intracluster altamente correlacionadas.

3voto

alexs77 Puntos 36

Después de investigar, llegué a la noción de un modelo de retardo distribuido que puede manejar una covariable finitamente observada o continuamente observada de forma retardada. El libro de Diggle, Heagerty, Liang, Zeger, Longitudinal Data Analysis, discute estos modelos en las páginas 260-263. Como dicen, es útil para modelar asociaciones o predecir resultados.

El modelo lineal es del tipo \begin{equation} E[Y_{it} | X_{is} : s < t] = \beta_{i0} + \sum_{r=1}^s \beta_r X_{ir} \end{equation}

El proceso es sencillo: se trata de construir modelos de regresión para el resultado ajustando todas las medidas relevantes de la exposición como covariables. Dado que sólo tengo 3 observaciones de la covariable "retardada" en cada miembro, me siento bastante seguro de poder utilizar las tres como valores de ajuste ajustando también la edad en el momento de la recogida para la exposición (ya que transcurrió una cantidad similar de tiempo de estudio entre las medidas para cada participante). Para la inferencia, normalmente se consideran las pruebas de df múltiples. He utilizado linearHypothesis en el car con el argumento de la hipótesis compuesta , hypothesis.matrix=paste0('riskmeas', 1:3, ' = 0') . También he utilizado diagramas de bosque para mostrar los IC de cada factor de riesgo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X