2 votos

Análisis de supervivencia para datos con medidas repetidas

Intento estudiar la deserción entre los estudiantes durante sus 3 años de licenciatura. Si mido los valores de varias características cada semestre durante un período de 3 años (o cualquier otra frecuencia), sólo algunas características cambian con el tiempo, otras no. Los datos del perfil del estudiante, como la nota del 12º curso o si es el primero de su familia en asistir a la universidad, no cambian con el tiempo. Pero el GPA, el número de unidades en las que se inscriben, etc. cambian con el tiempo. ¿Cómo puedo manejar esto en el Análisis de Supervivencia? ¿Cómo puedo tener en cuenta el hecho de que las 3 primeras filas pertenecen a un estudiante y las 2 siguientes a otro?

Nota: Para mí es más importante tener en cuenta el impacto del cambio de valores de algunas características en la deserción (como el hecho de que la carga de estudio haya pasado de 4 a 3 a 2) que saber en qué momento del curso lo abandonaron, lo cual también es bueno saber. Lo que quiero saber es si el cambio en los valores de algunas características ha provocado el abandono. Si hago una clasificación binaria, sólo estoy considerando una instantánea en el tiempo porque puedo tener sólo una fila por estudiante pero no toda la experiencia del estudiante.

Student   Year GPA    Year12-score First-in-family  Age Study-Load  Attrition
S1        Y1     4.5    78%             Yes          20  4           No 
S1        Y2     6.2    78%             Yes          21  3           No 
S1        Y3     6.1    78%             Yes          22  2           Yes
S2        Y1     8.2    82%             No           19  2           No
S2        Y2     6.9    82%             No           20  2           Yes

Además, dado el hecho de que el estudiante S1 abandonó en el tercer año, ¿debo marcar la etiqueta de abandono como "Sí" para los tres años?

1voto

EdM Puntos 5716

Esto requiere un análisis con covariantes temporales. El enfoque del análisis de supervivencia para esta situación está cubierto por un viñeta para la R survival paquete . Se codifica cada fila de datos con el Student ID del individuo*, la hora de inicio y la hora de finalización de un periodo de interés, si el suceso ocurrió al final de ese periodo de tiempo y los valores de las covariables existentes al inicio del periodo de tiempo (ya sean diferentes de los valores del periodo de tiempo anterior o no). El suceso se modela como dependiente de los valores de las covariables existentes justo antes del momento del suceso. (No caiga en la trampa de incluir covariables que cambian por el evento).

Si sus datos sólo incluyen valores anuales, es mejor tratar esto como un modelo de supervivencia en tiempo discreto, un modelo binomial (por ejemplo, logístico) que incluye el Year covariable como un efecto fijo junto con sus otras covariables.** De esta manera usted tiene una fila de datos para cada individuo para cada año junto con los valores de las covariables dependientes del tiempo para ese año. Al igual que en el análisis de supervivencia, se establece la variable binaria Attrition marque "Sí" sólo para el año en que se produjo.


*Si sólo hay un evento posible por estudiante, entonces el ID no es estrictamente necesario. Es fundamental si su modelo permite que un estudiante abandone, regrese y vuelva a abandonar; entonces debe tener en cuenta las correlaciones intraindividuales de la tendencia a abandonar.

**La mayoría de los análisis de supervivencia implementados por el programa R survival El paquete asume que el tiempo es continuo, por lo que lo ideal es que sólo ocurra un evento en un momento determinado. Aunque hay formas de tratar con tiempos de eventos empatados, si hay sólo unos pocos períodos de tiempo la modelización binomial con Year como un predictor de efecto fijo sería preferible.

0 votos

Gracias Para simplificar, voy a suponer que un estudiante abandona el curso sólo una vez durante el periodo de observación, es decir, que el evento ocurre sólo una vez.

0 votos

Con respecto a su sugerencia sobre el modelo de supervivencia en tiempo discreto, ¿no se pierde la intención de querer estudiar el cambio holístico de los valores de una característica a lo largo del tiempo? Me he dado cuenta de que podría ser un error etiquetar al estudiante como si hubiera abandonado en un año concreto. Debería tratarlo como un alumno que ha abandonado para todas las filas.

0 votos

¿Sugeriría un modelo de regresión logística de efectos mixtos si el tiempo hasta el evento no es importante, sino la ocurrencia del evento en sí?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X