5 votos

Análisis de datos de supervivencia longitudinal: predecir la supervivencia mediante una medida repetida a lo largo del tiempo

Este es un conjunto de datos simulado que pretende responder a una pregunta sobre si los sujetos con aumento de value entre trip (de v0 a v2 , 3 visitas) tendrán un tiempo de supervivencia significativamente más corto/largo ( time ) . El conjunto de datos simulado se muestra a continuación (puede reproducirse en R):

subj = rep(1:50, each=3)
trip = rep(c("v0", "v1", "v2"), 50)
value = round(abs(rnorm(n=150, mean=6, sd=2)), 3)
time = round(rexp(n=150, rate=0.3), 3)
censor = rep(rbinom(n=50, size=1, prob=0.5), each=3)
type = c(rep("type 1", 12), rep("type 2", 6), rep("type 3", 5), rep("type 4", 16), rep("type 5", 11))
dat = data.frame(subj, trip, value, time, censor, type)

Hay un total de 50 temas ( subj ), cada una con 3 visitas ( trip ), y para cada visita, hay una medida value tomada. Cada sujeto tuvo un tiempo de supervivencia ( time ), el estado de censura ( censor 0=censor, 1=muerte), y el tipo de enfermedad ( type ). Le rogamos que nos indique algún método estadístico bien establecido para este tipo de análisis. Lo ideal es que dichos métodos puedan ampliarse para incorporar covariables adicionales a nivel de sujeto, con la implementación del paquete R disponible. Probablemente el modelo PH de Cox con efecto aleatorio para el tipo de enfermedad ( type ) puede ser una forma de considerar? Gracias por las sugerencias.

4voto

Loffen Puntos 163

Desde el punto de vista filosófico, se presentan dos enfoques básicos. Uno de ellos consiste en buscar modelos estándar que (supuestamente) permitan "extraer" o "derivar" conocimientos de los datos. Yo identificaría este enfoque con inductivismo . Karl Popper llamó famosamente inducción "un mito", y comparto su opinión. Sin embargo, el inductivismo sigue siendo la epistemología dominante en las ciencias médicas (clínicas) en este momento. Su espíritu no está representado de forma más vívida que en el campo de la "ciencia de los datos", cuya premisa básica (me parece) es que los datos son como yacimientos subterráneos que hay que "extraer", y que para ello sólo necesitamos emplear el "equipo de movimiento de tierras" adecuado (es decir, técnicas o métodos ).

Un espíritu alternativo es el de la 'Inferencia Fuerte' descrita en un famoso ensayo de Platt [1,2]. En este caso, la atención se centra en construir y probar teorías . A pesar de la fuerte inclinación "inductivista" de muchos bayesianos, creo que el bayesiano métodos (a diferencia de la "bayesiana"). ismo ') constituyen una base muy adecuada para seguir una inferencia fuerte. Si está interesado, estaré encantado de ayudarle a seguir ese curso.

Actualmente, su código de simulación genera datos que tienen el apariencia formal del tipo de datos que podría recoger, pero no su contenido informativo . Para lograr esto último, habría que escribir en algunas ecuaciones (modelos) de un proceso de generación de datos ( DGP ) que describen lo que podría estar ocurriendo "bajo la superficie" en sus datos.

Si pudiera añadir dichas ecuaciones, le propondría mostrarle cómo implementar su modelo en JAGS un sistema de declarativo Herramienta de modelización bayesiana que tiene la encantadora propiedad de permitirle ejecutar el mismo modelo tanto "hacia delante" (desde los parámetros dados a los datos simulados) como "hacia atrás" (desde los datos medidos a la inferencia sobre los parámetros desconocidos).

Este enfoque le permitiría -como primera y quizás más importante ventaja- comprobar si las diversas teorías que podría considerar (expresadas en sus modelos de la DGP) cederían a la exploración en diferentes regímenes de tamaño de la muestra . Si el tamaño real de sus muestras es del orden del $N=50$ individuos de su simulación (divididos en 5 subtipos categóricos de enfermedad, nada menos), entonces no tendría grandes esperanzas de aprender nada nuevo que no sea ya "obvio" para los clínicos que tratan estos tipos de cáncer. Pero este enfoque le permitiría demostrar esa intuición de forma objetiva, al menos.

  1. Platt JR. Inferencia fuerte: Ciertos métodos sistemáticos de pensamiento científico pueden producir un progreso mucho más rápido que otros. Science. 1964;146(3642):347-353. doi:10.1126/science.146.3642.347 .

  2. Fudge DS. Cincuenta años de la inferencia fuerte de J. R. Platt. Journal of Experimental Biology. 2014;217(8):1202-1204. doi:10.1242/jeb.104976 .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X