9 votos

Comparación de las tasas de incidencia

Quiero comparar las tasas de incidencia entre dos grupos (uno sin enfermedad y otro con ella).

Pensaba calcular la tasa de incidencia (IRR), es decir, la tasa de incidencia del grupo B/la tasa de incidencia del grupo A, y luego probar si esta tasa es igual a 1, y finalmente calcular los intervalos de IC del 95% para la IRR.

Encontré un método para calcular el IC del 95% en un libro (Rosner's Fundamentos de la bioestadística ):

$$\exp\left[\log(\text{IRR}) \pm 1.96\sqrt{(1/a_1)+(1/a_2)}\right]$$

donde $a_1$ y $a_2$ es el número de eventos. Pero esta aproximación sólo es válida para tamaños de muestra suficientemente grandes y creo que el número de eventos que tengo es demasiado pequeño (quizá para la comparación total esté bien).

Así que creo que debería utilizar otro método.

Estoy usando R y el exactci y descubrí que tal vez podría utilizar poisson.test() . Pero esta función tiene 3 métodos para definir los valores p de dos lados: central, minlike y blaker.

Así que mis preguntas son:

  1. ¿Es correcto que para comparar dos tasas de incidencia se utilice un test de comparación de tasas de Poisson?

  2. Cuando se utiliza la función poisson.test en R del paquete exactci ¿qué método es el mejor?

El viñeta para exactci dice:

central: es 2 veces el mínimo de los valores p unilaterales limitados anteriormente por 1. El nombre "central" está motivado por los intervalos de de inversión asociados, que son intervalos centrales, es decir, que garantizan garantizan que el parámetro verdadero tiene menos de $\alpha/2$ probabilidad de ser menor (mayor) que la cola inferior (superior) del 100(1-) $\alpha$ )% intervalo de confianza. Esto se denomina método TST (twice the smaller tail ) por Hirji (2006).

como el mío: es la suma de las probabilidades de los resultados con probabilidades menores o iguales a la probabilidad observada. Hirji (2006) lo denomina método PB (basado en la probabilidad) por Hirji (2006).

blaker: combina la probabilidad de la cola más pequeña observada con la probabilidad más pequeña de la cola opuesta que no supera la probabilidad de la cola observada. El nombre "blaker" está motivado por Blaker (2000) que estudia exhaustivamente el método asociado para intervalos de con dencia. Este método se denomina método CT (cola combinada) por Hirji (2006).

Mis datos son:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0

2voto

Brettski Puntos 5485

Un par de pensamientos:

En primer lugar, la comparación que sugieres -la tasa de incidencia entre A y B- no está condicionada por ninguna covariable. Lo que significa que su número de eventos es de 54 para el Grupo A y 28 para el Grupo B. Eso es más que suficiente para ir con los métodos habituales de intervalo de confianza basados en muestras grandes.

En segundo lugar, incluso si se pretende ajustar el efecto de la edad, en lugar de calcular la proporción para cada grupo, podría ser mejor utilizar un enfoque de regresión. Por lo general, si se estratifica por muchos niveles de una variable, resulta bastante engorroso en comparación con una ecuación de regresión, que daría la relación de las tasas de A y B mientras se controla la edad. Creo que los enfoques estándar seguirán funcionando para su tamaño de muestra, aunque si le preocupa, podría utilizar algo como glmperm .

1voto

outis Puntos 608

La tasa de incidencia de cada grupo en sus datos no es más que la media de una suma de variables independientes de Bernoulli (0/1) - cada paciente tiene su propia variable que recibe un valor de 0 o 1, usted las suma y toma la media, que es la tasa de incidencia.

En muestras grandes (y su muestra es grande), la media se distribuirá normalmente, por lo que puede utilizar una simple prueba z para comprobar si los dos índices son diferentes o no.

En R, echa un vistazo a prop.test: http://stat.ethz.ch/R-manual/R-patched/library/stats/html/prop.test.html

Si quiere aprovechar al máximo los datos, intente ver si la distribución de las tasas de incidencia es diferente entre el grupo A y el B. Para ello, podría servir una prueba de independencia, como un chi-cuadrado o una prueba G: http://udel.edu/~mcdonald/statchiind.html

0voto

phaneron Puntos 1017

La única manera de estar seguro de que la muestra es lo suficientemente grande (o como diría Charlie Geyer - que realmente está en tierra asimétrica ) es hacer mucha simulación de Monte-Carlo o, como sugirió EpiGard, utilizar algo como glmperm.

En cuanto a qué método es el mejor en exactci, aquí no hay ninguno mejor, o como decía Fisher

¿Lo mejor para qué?

Michael Fay ofrece algunas aclaraciones aquí

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X