5 votos

Cambio de la métrica temporal para los datos longitudinales

Tengo algunos datos longitudinales. He hecho análisis longitudinal antes, pero nunca he cambiado la métrica del tiempo, así que quería correr el proceso de que por usted.

Editado para mayor claridad: Tengo datos de medidas repetidas recogidos a lo largo de unos 2 meses, pero el estudio tiene que ver con el COVID, por lo que el tiempo (y el paso del tiempo) es un componente importante. Las personas que comienzan el estudio, por ejemplo, el 14 de mayo, pueden ser muy diferentes a las que llegan el 1 de junio en términos de nuestras variables. Quiero reestructurar el análisis para examinar los efectos del tiempo. Así que quiero pasar de un escenario en el que tengo un tiempo relativamente equilibrado (tiempo 1, tiempo 2, tiempo 3) agnóstico a la hora de entrada real, y reestructurar el análisis para tener en cuenta las fechas específicas en las que cada uno de los individuos 5 puntos de tiempo fueron recogidos - un escenario de tiempos de observación que varían individualmente. Propongo reestructurar los datos indexando el análisis recodificando para cada participante sus 5 puntos de tiempo en "días desde el comienzo del estudio" e incluir eso como mi métrica de tiempo. Pienso utilizar un modelo lineal de efectos mixtos y utilizar esta nueva métrica temporal como mi covariable "tiempo" en el modelo.

A continuación, detallo un poco más la forma específica en que quiero reestructurar esto. Pero TLDR: Quiero saber a) si esto es defendible y b) si mi método de hacerlo tiene sentido a continuación.

Original: Detalles:

5 tomas de datos, espaciadas equitativamente cada 7 días. Así, t1= ingesta, t2= día 7, t3 = día 14, t4 = día 21, t5 = día 28. Tamaño de la muestra ~1500, por supuesto algunos datos faltantes debido a la deserción a medida que pasa el tiempo. Se permitió a los participantes comenzar el estudio en el transcurso de aproximadamente un mes, y hay una distribución bastante buena de las ingestas a lo largo de ese mes en el que la encuesta estuvo abierta.

En lugar de analizar el cambio sólo a través de la ocasión de medición, donde el eje X es t1, t2, t3, t4, t5, me gustaría reescalar la métrica del tiempo para capturar el día real dentro de este período de tiempo completo en el que se recogieron los datos y analizar el cambio a través del tiempo de esa manera en lugar de ser sólo agnóstico a la fecha real. Convirtiendo el eje X en Día 1, Día 2..., Día 60". Esto es porque tengo razones para creer que el cambio en mi variable de resultado será una función del paso del tiempo.

Pero, como se puede imaginar, cuando se conceptualiza de esta manera (como días) no todos los días serán comunes a todos los participantes (es decir, algunos empezaron en el día 3, y otros en el día 30, y todo lo demás). Por lo tanto, se trata más bien de un conjunto de datos no estructurados en el tiempo, por lo que examinaré el cambio a lo largo del tiempo mediante una curva de crecimiento utilizando un modelo de efectos mixtos.

Así es como pienso hacer este cambio de métrica temporal: Paso 1: crear variables que muestren las puntuaciones de y en todos los ~60 días posibles. Paso 2: recodificar los datos existentes de las 5 ocasiones de medición de cada participante en datos organizados por "día" en lugar de (t1, t2, t3 ,t4, t5) basados en la fecha de ingesta. Por ejemplo, alguien que comenzó el estudio el día 1 tiene su primer punto de tiempo ahora etiquetado como 'día 1 Y', mientras que alguien que comenzó el estudio el día 15 tiene su primer punto de tiempo etiquetado como 'día 15 y' en el conjunto de datos (y sus puntos de tiempo posteriores 7 días después, es decir, 'día 21'). Paso 3: reestructurar los datos al formato de período de la persona (utilizando los ID de los participantes).
Paso 4: ejecutar la curva de crecimiento (con el tiempo que ahora representa el día y los rangos de 1-60), con el intercepto y el tiempo como efectos aleatorios utilizando el modelo de efectos mixtos.

TLDR: Quiero cambiar a una "métrica temporal que varía individualmente" (Grim et al., 2017). He recodificado mis datos para cambiar la métrica temporal de ocasión de medición a "día" para capturar el cambio en el tiempo. ¿Es lo que he hecho apropiado/correcto?

¿O tendría más sentido incluir la fecha (operacionalizada como día1, día2...etc.) como covariable utilizando la métrica original?

Cualquier ayuda será muy apreciada.

A continuación se muestra un ejemplo visual de lo que hice usando algunos números aleatorios:

enter image description here

A continuación, la reestructuración por pares.

3voto

EdM Puntos 5716

¿tendría más sentido incluir la fecha... como covariable utilizando la métrica original?

Así es como se manejan este tipo de situaciones en el análisis de supervivencia, si he entendido bien tu pregunta.

En el análisis de supervivencia, una referencia temporal de time = 0 se suele establecer como la fecha de entrada en un estudio, que se codifica como t1 . De este modo, la situación en el tiempo de cada individuo se expresa en relación con el tiempo inicial de ese individuo.

Si hay cambios en las condiciones subyacentes a lo largo del tiempo del calendario que puedan afectar a la medida del resultado en la población subyacente (como sospecha en su estudio), la fecha de entrada en el calendario puede utilizarse como covariable para cada individuo. De este modo, para cada individuo se evalúan los cambios a lo largo del tiempo desde la entrada de ese individuo en el estudio al tiempo que se tienen en cuenta las diferencias sistemáticas entre los miembros de la población a lo largo del tiempo.

La especificación de la fecha de entrada en el calendario como covariable permite capturar los cambios no lineales a lo largo del tiempo del calendario con técnicas de regresión como los splines cúbicos restringidos. Tendrá que utilizar su conocimiento del tema para determinar si modela la fecha de entrada del calendario como una contribución al resultado sólo con respecto a los interceptos, o con respecto a las pendientes (por ejemplo, los cambios en los resultados de los individuos a lo largo de sus propios tiempos desde la entrada) también.

Esto significa que tendría 2 tipos diferentes de tiempos especificados para cada observación: un tiempo dentro del individuo relativo a la entrada en el estudio que cambia de una observación a otra para ese individuo, y un tiempo de calendario entre individuos que representa la fecha fija de entrada en el estudio para cada individuo.

En respuesta a los comentarios:

No veo nada que ganar informando de modelos separados. Lo mejor sería un modelo combinado y completo. Dejaremos de lado por ahora que su resultado es evidentemente ordinal; simplemente modele eso apropiadamente e interprete cualquier afirmación sobre tendencias "lineales" en términos del predictor lineal en lugar del resultado per se.

Para minimizar la ambigüedad, vamos a llamar a la fecha de entrada en el calendario entryDate para un individuo. Llame al punto de tiempo de cada recogida de datos, en relación con un individuo entryDate El measurementTime . Así que measurementTime = 0 en un individuo entryDate .

La siguiente, en sintaxis de fórmula R (el intercepto está implícito), es la más simple que permite que tanto el tiempo dentro de los individuos como el tiempo de calendario contribuyan al resultado:

Outcome ~ entryDate + measurementTime + (other covariates) + (1|ID)

El efecto aleatorio permite las diferencias entre los individuos (ID) con respecto al intercepto. El entryDate prevé una tendencia lineal general de los resultados a lo largo del tiempo, y measurementTime proporciona una tendencia lineal en el resultado dentro de los individuos (igual para cada individuo) a partir de la entryDate teniendo en cuenta la asociación de entryDate con resultado.

Dependiendo de su comprensión del tema, podría ampliar el modelo para examinar las relaciones no lineales entre cada uno de entryDate y measurementTime y Outcome y examinar una interacción entre entryDate y measurementTime (permitiendo que la tasa de cambio del resultado dentro de los individuos varíe sistemáticamente con entryDate ). En el modelo anterior no hay ningún efecto aleatorio especificado para measurementTime Así que deberías tener suficientes datos para evaluar esas posibilidades.

Tal vez se podrían tener en cuenta las tasas de cambio específicas de cada persona con measurementTime con un efecto aleatorio de (1 + measurementTime | ID) pero, como usted señala, eso podría ser llevar las cosas demasiado lejos si hay algo más que una tendencia lineal con respecto a measurementTime dentro de un individuo. No veo que se gane mucho incorporando entryDate en un efecto aleatorio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X