7 votos

¿Cómo calcular el "intervalo de confianza exacto" para el riesgo relativo?

Estoy trabajando con algunos datos de SARM y necesito calcular el riesgo relativo de un grupo de hospitales en comparación con el resto de hospitales.

Mis compañeros me lanzan un excel con una fórmula dentro para calcular el "intervalo de confianza exacto del riesgo relativo", puedo hacer el cálculo sin dificultades, pero no tengo ni idea de cómo y por qué se utiliza esta fórmula para hacer dicho cálculo.

He adjuntado el archivo excel aquí para su referencia.

¿Puede alguien mostrarme una referencia sobre el fundamento del cálculo? Un artículo de los libros de texto me parece bien. Gracias.

11voto

DavLink Puntos 101

Compruebe la R Epi y epitools que incluyen muchas funciones para calcular los ICs/p-valores exactos y aproximados para varias medidas de asociación encontradas en estudios epidemiológicos, incluyendo el riesgo relativo (RR). Sé que también hay PropCIs pero nunca lo he probado. El Bootstraping también es una opción, pero generalmente se trata de ICs exactos o aproximados que se proporcionan en los trabajos epidemiológicos, aunque la mayoría de los estudios explicativos se basan en el GLM, y por lo tanto hacen uso de la odds-ratio (OR) en lugar del RR (aunque, erróneamente es a menudo el RR el que se interpreta porque es más fácil de entender, pero esta es otra historia).

También puedes comprobar tus resultados con la calculadora online, como en statpages.org o Intervalos de confianza del riesgo relativo y de la diferencia de riesgo . Este último explica cómo se realizan los cálculos.

Por pruebas "exactas", generalmente nos referimos a pruebas/IC que no dependen de una distribución asintótica, como la chi-cuadrado o la normal estándar; por ejemplo, en el caso de un RR, un IC del 95% puede aproximarse como $\exp\left[ \log(\text{rr}) - 1.96\sqrt{\text{Var}\big(\log(\text{rr})\big)} \right], \exp\left[ \log(\text{rr}) + 1.96\sqrt{\text{Var}\big(\log(\text{rr})\big)} \right]$ , donde $\text{Var}\big(\log(\text{rr})\big)=1/a - 1/(a+b) + 1/c - 1/(c+d)$ (suponiendo una tabla de clasificación cruzada de 2 vías, con $a$ , $b$ , $c$ y $d$ que indica la frecuencia de las células). No obstante, las explicaciones de @Keith son muy perspicaces.

Para más detalles sobre el cálculo de los IC en epidemiología, sugeriría consultar el libro de texto de Rothman y Greenland, Epidemiología moderna (ahora en su tercera edición), Métodos estadísticos para tasas y proporciones de Fleiss et al., o Análisis estadísticos del riesgo relativo de J.J. Gart (1979).

Por lo general, obtendrá resultados similares con fisher.test() como señala @gd047, aunque en este caso esta función le proporcionará un IC del 95% para la odds-ratio (que en el caso de una enfermedad con baja prevalencia estará muy cerca del RR).

Notas:

  1. No he comprobado tu archivo Excel, por la razón que defiende @csgillespie.
  2. Michael E Dewey ofrece un interesante resumen de intervalos de confianza para los coeficientes de riesgo de un resumen de mensajes en la lista de correo de R.

6voto

Iain Holder Puntos 7930

No existe un único intervalo de confianza exacto para el cociente de dos proporciones. En general, un intervalo de confianza exacto del 95% es cualquier procedimiento de generación de intervalos que garantice al menos el 95% de cobertura de la proporción verdadera, independientemente de los valores de las proporciones subyacentes.

Un intervalo formado por la prueba exacta de Fisher es probablemente demasiado conservador, ya que tiene una cobertura superior al 95% para la mayoría de los valores de los parámetros. No es erróneo, pero también es más amplio de lo que tiene que ser.

El intervalo utilizado por el software StatXact con la configuración por defecto sería una mejor opción en este caso - creo que utiliza alguna variedad de intervalo Chan (es decir, un intervalo de búsqueda de extremos utilizando el procedimiento de Berger-Boos y una estadística estandarizada), pero tendría que comprobar el manual para estar seguro.

Cuando pregunta por el "cómo y el porqué", ¿responde esto a su pregunta? Creo que ciertamente podríamos exponer más sobre la definición de los intervalos de confianza y cómo construir uno desde cero si eso es lo que estabas buscando. ¿O basta con decir que se trata de un intervalo basado en la prueba exacta de Fisher, uno (pero no el único ni el más potente) de los intervalos de confianza que garantiza su cobertura de forma incondicional?

(Nota: Algunos autores reservan la palabra "exacto" para aplicarla sólo a los intervalos y pruebas en los que los falsos positivos se controlan exactamente en alfa, en lugar de limitarse simplemente a alfa. Tomado en este sentido, simplemente no hay un intervalo de confianza exacto determinista para la relación de dos proporciones, y punto. Todos los intervalos deterministas son necesariamente aproximados. Por supuesto, aun así algunos intervalos y pruebas controlan incondicionalmente el error de tipo I y otros no).

4voto

reconbot Puntos 1670

Esto parece ser la prueba exacta de Fisher para datos de conteo. Puede reproducir los resultados en R dando:

data <- matrix(c(678,4450547,63,2509451),2,2)
fisher.test(data)

data:  data 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 4.682723 7.986867 
sample estimates:
odds ratio 
  6.068817

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X