Tengo un experimento que se producen observaciones del tiempo hasta que se produce un evento. Algunas propiedades básicas son que
- Contamos el número de eventos que han ocurrido en algún punto de $t_1,...,t_n$.
- Las horas de los eventos son de intervalos censurados, entre el $(t-1,t]$,
- Los individuos no va a dejar el juicio entre el $t_1,...t_n$, que es un individuo cualquiera de las experiencias en el evento al $t_1$ o no, en qué punto se están censurados,
- Una gran proporción de las personas no reciban el evento por $t_n$, cuando damos por terminado el experimento, y
- Yo no asume ningún tipo de subyacente paramétrico de la decadencia de los modelos.
Parece ser un natural de aplicación para el análisis de supervivencia. Sin embargo, es complicado por el hecho de que es trivial para repetir el experimento de la misma configuración inicial varias veces. En efecto, vamos a tener un conjunto de $m_{1,...,s}$ evento que cuenta (donde $s$ es el número de muestras) para cada tiempo de observación $t_i$. Soy relativamente nuevo en las estadísticas, y yo estoy luchando para ver cómo aplicar el análisis de supervivencia de este tipo de datos (si es aplicable y no hay métodos más adecuados para medir este tipo de tiempo-para-datos del evento). Mi inclinación es la construcción de la supervivencia de la función alrededor de la media del número de eventos observados en cada intervalo (es decir,$\bar{m}_{1,...,n}$), que mejor debería aproximar el número esperado de eventos en cada intervalo en la población, sin embargo no tengo idea de si esto es apropiado o de sus implicaciones.
He buscado en vano en Google Scholar, si alguien pudiera punto de que me de más material (o me dan la correcta nomenclatura para lo que yo estoy tratando de hacer), se agradecería.
Editar
Dado que el $(t-1, t]$ intervalos son uniformes en todas las muestras, decir que he tenido la siguiente matriz que describe el número acumulado de individuos para los que se ha producido un evento en cada intervalo de tiempo
$M = \left(\begin{array}{ccc} 0 & 24 & 35 & 52 & 60 & 71 \\ 0 & 22 & 38 & 57 & 64 & 75 \\ 0 & 26 & 34 & 55 & 62 & 72 \\ 0 & 21 & 32 & 52 & 61 & 73 \end{array}\right)$
donde cada fila indica el número de eventos para el mismo conjunto de individuos en riesgo en $t=0$ a través de todas las muestras (es decir, varias instancias del experimento), y cada columna es un intervalo de observación. Supongo que por tomar el número medio de eventos para cada intervalo, puedo obtener una mejor estimación de la expectativa de supervivencia de la población, así que vamos a $n$ denotar el número de intervalos de tiempo, $s$ denotar el número de muestras (experimento casos), entonces el vector de
$\bar{M} = \left[ {{\sum_{i=1}^{s}M_{es}}\over{s}} \right]_{t=1...n}$
será la media del número de eventos observados para cada intervalo de tiempo.
Mi objetivo, entonces, es el uso de esta como la entrada para la supervivencia de la estimación. Deje $f$ el número de personas en situación de riesgo al $t=0$. El uso de los ingenuos estimador (por ahora, dado que el evento intervalos son uniformes en todas las muestras y que no hay censura hasta $t_n$), el sobreviviente de la función podría ser estimado como:
$S(t) = {{f - \bar{M}_t}\over{f}}$
Que (esperemos) ser una mejor estimación de la supervivencia de la población que cualquier individuo de la muestra (de una sola fila de $M$). A reformular mi pregunta:
- Es $\bar{M}$ una entrada correspondiente a una estimación de la función de supervivencia? No he visto a este enfoque en cualquiera de los materiales que he leído.
- Como soy realmente, dolorosamente un novato en las estadísticas, puede que alguien me apunte a algún material (artículos académicos, libros de texto, wikis, etc. estaría bien) en la estimación del intervalo de confianza y la varianza para esta supervivencia de la estimación de la función? Supongo que no será idéntica a la de formulaciones estándar.
Disculpas si mi pregunta original era confuso, probablemente no incluyen suficiente información.