Tengo algunos datos longitudinales. He hecho análisis longitudinal antes, pero nunca he cambiado la métrica del tiempo, así que quería correr el proceso de que por usted.
Editado para mayor claridad: Tengo datos de medidas repetidas recogidos a lo largo de unos 2 meses, pero el estudio tiene que ver con el COVID, por lo que el tiempo (y el paso del tiempo) es un componente importante. Las personas que comienzan el estudio, por ejemplo, el 14 de mayo, pueden ser muy diferentes a las que llegan el 1 de junio en términos de nuestras variables. Quiero reestructurar el análisis para examinar los efectos del tiempo. Así que quiero pasar de un escenario en el que tengo un tiempo relativamente equilibrado (tiempo 1, tiempo 2, tiempo 3) agnóstico a la hora de entrada real, y reestructurar el análisis para tener en cuenta las fechas específicas en las que cada uno de los individuos 5 puntos de tiempo fueron recogidos - un escenario de tiempos de observación que varían individualmente. Propongo reestructurar los datos indexando el análisis recodificando para cada participante sus 5 puntos de tiempo en "días desde el comienzo del estudio" e incluir eso como mi métrica de tiempo. Pienso utilizar un modelo lineal de efectos mixtos y utilizar esta nueva métrica temporal como mi covariable "tiempo" en el modelo.
A continuación, detallo un poco más la forma específica en que quiero reestructurar esto. Pero TLDR: Quiero saber a) si esto es defendible y b) si mi método de hacerlo tiene sentido a continuación.
Original: Detalles:
5 tomas de datos, espaciadas equitativamente cada 7 días. Así, t1= ingesta, t2= día 7, t3 = día 14, t4 = día 21, t5 = día 28. Tamaño de la muestra ~1500, por supuesto algunos datos faltantes debido a la deserción a medida que pasa el tiempo. Se permitió a los participantes comenzar el estudio en el transcurso de aproximadamente un mes, y hay una distribución bastante buena de las ingestas a lo largo de ese mes en el que la encuesta estuvo abierta.
En lugar de analizar el cambio sólo a través de la ocasión de medición, donde el eje X es t1, t2, t3, t4, t5, me gustaría reescalar la métrica del tiempo para capturar el día real dentro de este período de tiempo completo en el que se recogieron los datos y analizar el cambio a través del tiempo de esa manera en lugar de ser sólo agnóstico a la fecha real. Convirtiendo el eje X en Día 1, Día 2..., Día 60". Esto es porque tengo razones para creer que el cambio en mi variable de resultado será una función del paso del tiempo.
Pero, como se puede imaginar, cuando se conceptualiza de esta manera (como días) no todos los días serán comunes a todos los participantes (es decir, algunos empezaron en el día 3, y otros en el día 30, y todo lo demás). Por lo tanto, se trata más bien de un conjunto de datos no estructurados en el tiempo, por lo que examinaré el cambio a lo largo del tiempo mediante una curva de crecimiento utilizando un modelo de efectos mixtos.
Así es como pienso hacer este cambio de métrica temporal: Paso 1: crear variables que muestren las puntuaciones de y en todos los ~60 días posibles. Paso 2: recodificar los datos existentes de las 5 ocasiones de medición de cada participante en datos organizados por "día" en lugar de (t1, t2, t3 ,t4, t5) basados en la fecha de ingesta. Por ejemplo, alguien que comenzó el estudio el día 1 tiene su primer punto de tiempo ahora etiquetado como 'día 1 Y', mientras que alguien que comenzó el estudio el día 15 tiene su primer punto de tiempo etiquetado como 'día 15 y' en el conjunto de datos (y sus puntos de tiempo posteriores 7 días después, es decir, 'día 21'). Paso 3: reestructurar los datos al formato de período de la persona (utilizando los ID de los participantes).
Paso 4: ejecutar la curva de crecimiento (con el tiempo que ahora representa el día y los rangos de 1-60), con el intercepto y el tiempo como efectos aleatorios utilizando el modelo de efectos mixtos.
TLDR: Quiero cambiar a una "métrica temporal que varía individualmente" (Grim et al., 2017). He recodificado mis datos para cambiar la métrica temporal de ocasión de medición a "día" para capturar el cambio en el tiempo. ¿Es lo que he hecho apropiado/correcto?
¿O tendría más sentido incluir la fecha (operacionalizada como día1, día2...etc.) como covariable utilizando la métrica original?
Cualquier ayuda será muy apreciada.
A continuación se muestra un ejemplo visual de lo que hice usando algunos números aleatorios:
A continuación, la reestructuración por pares.