Básicamente lo que hace es correcto acerca de la organización de los datos. Si usted tiene casos organizados así:
ID M1 M2 M3 EVENT
Es probable que se desea reorganizar los datos para que se parezca a esto:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Yo llamo a esto la conversión de gran formato a un formato largo. Esto se hace fácilmente en R usando el reshape()
función o incluso más fácilmente con la reshape2
paquete.
Yo personalmente me quedaría con el ID
de campo para su uso potencial en la identificación de la fuente de variación en un modelo de efectos mixtos. Pero esto no es necesario (como se ha señalado por @BerndWeiss). El siguiente asume que quisiera hacerlo. Si no, ajuste un modelo similar con glm(...,family=binomial)
sin el efecto aleatorio de los términos.
El lme4
paquete en R se ajuste a una de efectos mixtos modelo de regresión logística similar a la que estás hablando, excepto con un efecto aleatorio o dos para dar cuenta de la variabilidad en los coeficientes de todas las materias (ID
). El siguiente podría ser un ejemplo de código para el ajuste de un modelo de ejemplo, si los datos son almacenados en una estructura de datos llamada df
.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Este modelo en particular permite la TIME
y intercept
coeficientes que varían al azar a través de ID. En otras palabras, este es un jerárquica lineal modelo mixto de medidas anidados en los individuos.
Una forma alternativa de un tiempo discreto historial de eventos del modelo rompe TIME
en discretas dummies y se adapta a cada uno como un parámetro. Este es esencialmente el discretos caso de la Cox PH modelo ya que el riesgo de la curva no se limita a ser lineal o cuadrática, o sin embargo usted puede imaginar la transformación de tiempo). Aunque, puede que desee grupo TIME
a un conjunto manejable (es decir, pequeños) de discretos períodos de tiempo si hay un montón de ellos.
Más suplentes que implican la transformación de tiempo para obtener su peligro de la curva de la derecha. El anterior método, básicamente, alivia el tener que hacer esto, pero el método anterior es menos parsimonioso que este (y el original lineales caso que me plantea debido a que usted puede tener un montón de puntos en el tiempo y por lo tanto, una gran cantidad de molestias parámetros.
Una excelente referencia sobre este tema es Judith Cantante y John Willet es Aplicado Longitudinal de Análisis de Datos: Modelado de Cambio y la Aparición de Eventos.