6 votos

Análisis de supervivencia con variable categórica

Tengo datos de tiempo de evento para sujetos con diferentes categorías (A, B, C, etc.) observadas anualmente. A mi entender, mis datos están censurados tanto por la derecha como por el intervalo (?).

La categoría de los sujetos puede cambiar de un año a otro, por ejemplo, A para los años 0 a 2, que B a partir del año 3 para el sujeto 1, etc. Cada asignatura puede estar expuesta al "evento" independientemente de su categoría. Por el momento no me interesan los efectos de transición.

¿Qué estimadores se pueden sugerir para la probabilidad de fallo a un año por categoría?

3voto

Brettski Puntos 5485

Puede dividir cada uno de sus pacientes en varios registros. Por ejemplo, si el paciente Joe es seguido durante 5 años, cambiando de A a B dos años dentro, y de B a C dos años después, tendría tres registros. Joe # 1 que entró en el año 0, y salió en el año 2. Joe # 2 que entra en el año 2 y sale en el año 4, y Joe # 3, que entra en el año 4 y sale en el año 5.

A continuación, se utiliza un estimador de varianza robusto que tiene en cuenta el hecho de que usted tiene algunos no-independencia en sus datos, y se puede ejecutar cualquier análisis de supervivencia que desee. Sospecho que si estás buscando una probabilidad de fracaso de 1 año, utilizarías algún estimador paramétrico de la curva de supervivencia, o un análisis de tipo Kaplan-Meyer.

1voto

John with waffle Puntos 3472

El enfoque más sencillo consiste en dividir cada sujeto en múltiples años-persona con cada año asociado a una sola categoría y un indicador de evento sí/no. De este modo se pueden obtener las probabilidades anuales sin dificultad. Tenga en cuenta que esto supondría que las probabilidades son constantes a lo largo del tiempo. Se puede utilizar la regresión de Poisson para la inferencia.

0voto

Matt Puntos 108

Si entiendo bien su descripción, su caso entra dentro de análisis de supervivencia/riesgo en tiempo discreto (tiempo discreto en el sentido de intervalos discretizados de un proceso continuo, no en el sentido de que los acontecimientos sólo se producen después de intervalos fijos).

En ese caso, seguiría la sugerencia de Aniko y utilizaría un modelo de regresión logística con años-persona como observaciones, con la ocurrencia de eventos como variable dependiente y la categoría como variable explicativa variable en el tiempo (junto con el tiempo, por supuesto).

Un manual aplicado que se recomienda para este caso es Applied Longitudinal Data Analysis de Singer & Willett, cap. 10-12. Véase aquí para ejemplos/sintaxis trabajados para diferentes programas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X