8 votos

Aplicación adecuada de análisis de supervivencia

Tengo un experimento que se producen observaciones del tiempo hasta que se produce un evento. Algunas propiedades básicas son que

  1. Contamos el número de eventos que han ocurrido en algún punto de $t_1,...,t_n$.
  2. Las horas de los eventos son de intervalos censurados, entre el $(t-1,t]$,
  3. Los individuos no va a dejar el juicio entre el $t_1,...t_n$, que es un individuo cualquiera de las experiencias en el evento al $t_1$ o no, en qué punto se están censurados,
  4. Una gran proporción de las personas no reciban el evento por $t_n$, cuando damos por terminado el experimento, y
  5. Yo no asume ningún tipo de subyacente paramétrico de la decadencia de los modelos.

Parece ser un natural de aplicación para el análisis de supervivencia. Sin embargo, es complicado por el hecho de que es trivial para repetir el experimento de la misma configuración inicial varias veces. En efecto, vamos a tener un conjunto de $m_{1,...,s}$ evento que cuenta (donde $s$ es el número de muestras) para cada tiempo de observación $t_i$. Soy relativamente nuevo en las estadísticas, y yo estoy luchando para ver cómo aplicar el análisis de supervivencia de este tipo de datos (si es aplicable y no hay métodos más adecuados para medir este tipo de tiempo-para-datos del evento). Mi inclinación es la construcción de la supervivencia de la función alrededor de la media del número de eventos observados en cada intervalo (es decir,$\bar{m}_{1,...,n}$), que mejor debería aproximar el número esperado de eventos en cada intervalo en la población, sin embargo no tengo idea de si esto es apropiado o de sus implicaciones.

He buscado en vano en Google Scholar, si alguien pudiera punto de que me de más material (o me dan la correcta nomenclatura para lo que yo estoy tratando de hacer), se agradecería.

Editar

Dado que el $(t-1, t]$ intervalos son uniformes en todas las muestras, decir que he tenido la siguiente matriz que describe el número acumulado de individuos para los que se ha producido un evento en cada intervalo de tiempo

$M = \left(\begin{array}{ccc} 0 & 24 & 35 & 52 & 60 & 71 \\ 0 & 22 & 38 & 57 & 64 & 75 \\ 0 & 26 & 34 & 55 & 62 & 72 \\ 0 & 21 & 32 & 52 & 61 & 73 \end{array}\right)$

donde cada fila indica el número de eventos para el mismo conjunto de individuos en riesgo en $t=0$ a través de todas las muestras (es decir, varias instancias del experimento), y cada columna es un intervalo de observación. Supongo que por tomar el número medio de eventos para cada intervalo, puedo obtener una mejor estimación de la expectativa de supervivencia de la población, así que vamos a $n$ denotar el número de intervalos de tiempo, $s$ denotar el número de muestras (experimento casos), entonces el vector de

$\bar{M} = \left[ {{\sum_{i=1}^{s}M_{es}}\over{s}} \right]_{t=1...n}$

será la media del número de eventos observados para cada intervalo de tiempo.

Mi objetivo, entonces, es el uso de esta como la entrada para la supervivencia de la estimación. Deje $f$ el número de personas en situación de riesgo al $t=0$. El uso de los ingenuos estimador (por ahora, dado que el evento intervalos son uniformes en todas las muestras y que no hay censura hasta $t_n$), el sobreviviente de la función podría ser estimado como:

$S(t) = {{f - \bar{M}_t}\over{f}}$

Que (esperemos) ser una mejor estimación de la supervivencia de la población que cualquier individuo de la muestra (de una sola fila de $M$). A reformular mi pregunta:

  1. Es $\bar{M}$ una entrada correspondiente a una estimación de la función de supervivencia? No he visto a este enfoque en cualquiera de los materiales que he leído.
  2. Como soy realmente, dolorosamente un novato en las estadísticas, puede que alguien me apunte a algún material (artículos académicos, libros de texto, wikis, etc. estaría bien) en la estimación del intervalo de confianza y la varianza para esta supervivencia de la estimación de la función? Supongo que no será idéntica a la de formulaciones estándar.

Disculpas si mi pregunta original era confuso, probablemente no incluyen suficiente información.

5voto

Runcible Puntos 539

Recientemente he tenido un conjunto de intervalos censurados los datos de supervivencia, así que sé exactamente lo que usted necesita. Si usted ha usado R, esto debería ayudar.

Si usted no desea asumir una forma paramétrica, acerca de cómo un intervalo censurado de riesgos proporcionales de Cox modelo? El intcox paquete que hacer esto ya no está en la R repositorio. Yo sugeriría que la imputación de los tiempos de supervivencia y, a continuación, utilizando la coxph función de la survival biblioteca. Tenga en cuenta que sus errores estándar será demasiado baja el uso de este método; no representan la incertidumbre de no saber exactamente el tiempo de supervivencia. Si desea intervalo censurado las estimaciones de supervivencia, el uso de la icfit función de la interval paquete.

Otra forma de analizar el efecto de las covariables en el tiempo de supervivencia es mediante el uso de intervalos censurados, no paramétricos de regresión. Ver el R paquete ICE: http://cran.r-project.org/web/packages/ICE/ICE.pdf. Primero se necesita para la imputación de los promedios de tiempo de supervivencia, luego de hacer un local de regresión lineal utilizando el locpoly función de la np paquete. No es tan difícil como parece.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X