9 votos

Estimador para una tasa de incidencia de

Al ir a través de un curso de estadísticas para estudiantes de medicina, corrí al otro lado de un problema relacionado con las tasas de incidencia. El contexto del problema es un capítulo acerca de la distribución de Poisson. En el problema, 2300 fumadores son seguidos durante 1 año, tiempo durante el cual el 24 de desarrollar cáncer de pulmón. Se desea calcular la tasa de incidencia del proceso y proceda de la siguiente manera:

$$\text{Incidence rate} = \frac{24}{2300-24/2}$$

En primer lugar, yo no entendía por qué se resta $24/2$, pero supuse que era algo de corrección por el hecho de que desde los 24 a las personas a desarrollar el cáncer durante el año, su tiempo en el riesgo es más corta que la de los no desarrollar la enfermedad. Ninguna otra información fue dada en el libro de texto en sí, al menos no en el problema. Una búsqueda rápida confirmó que estoy pensando que a lo largo de las líneas correctas.

Pero todavía no entiendo la razón por la fórmula. Alguien que me ilumine? También, si algunas referencias accesibles a los estudiantes de medicina podría ser dado. No me importa tener más técnicos referencias así.

7voto

user8076 Puntos 16

Propongo el modelado de la ocurrencia de cáncer como un proceso de Poisson. Varios eventos (aparición de tumores) son posibles en el mismo individuo durante el período de tiempo de observación. Si $\lambda$ es la tasa de aparición de tumores por año, la probabilidad de 0 eventos es $e^{-\lambda}$, y la probabilidad de 1 evento o más es $p=1-e^{-\lambda}$.

Usted siga $n$ de los individuos durante un año. El número de individuos con 1 evento o más es $X \sim \mathrm{Bin}(n,p)$. El número esperado es $E(X) = np = n(1-e^{-\lambda})$.

Ahora observe $x$ eventos y queremos estimar $\lambda$. Primera estimación de $\hat p = {x\over n}$,$\hat \lambda = - \log\left(1 - {x \over n}\right) \approx {x\over n} + {x^2 \over 2 n^2}$. Por la invariancia de máxima probabilidad de los estimadores, $\hat \lambda$ es el MLE de $\lambda$.

Su estimador es ${ x/n \over 1 - x/2n} \approx {x\over n} + {x^2 \over 2 n^2}$. La diferencia entre los dos estimadores es acerca de $x^3/6n^3$, que es muy pequeño si $x/n$ es pequeña. Supongo que esto proporciona alguna justificación, aunque algunos otros de modelado podría conducir directamente a su estimador.

3voto

AdamSane Puntos 1825

Suponiendo que los diagnósticos de cáncer están uniformemente repartidas en todo el año, las personas que son diagnosticadas están expuestos al riesgo de ser diagnosticado (promedio) en la mitad de un año antes de que el diagnóstico.

Su enlace se menciona el supuesto de la ocurrencia en el punto a mitad de camino en el periodo de observación, pero no se de donde viene - que es el supuesto de la homogeneidad. Esta suposición no siempre es razonable, y hay veces cuando se puede hacer una diferencia sustancial. Me gustaría recomendar el de ser conscientes de que la suposición de que cada vez que uso la fórmula, porque usted debe considerar su idoneidad y si no es el adecuado, si es probable que tenga un impacto sustantivo en la estimación (en cuyo caso, una mejor suposición acerca de la ocurrencia debe ser investigado)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X