3 votos

Intervalos de confianza para un riesgo relativo en el que faltan los datos subyacentes

Tengo dos tasas estimadas y sus intervalos de confianza del 95%, pero no los datos subyacentes. Tomo el cociente de los dos para obtener un riesgo relativo, pero ¿cómo determino los intervalos de confianza del 95% para ese riesgo relativo?

Ejemplo: Al inicio del estudio tengo una tasa estimada de 38,3 (IC 95%, 36,0-40,8) y en el grupo de estudio tengo una tasa estimada de 45,2 (IC 95%, 43,2-47,2). El riesgo relativo es de 1,18, pero cuáles son los límites de confianza del 95%. No tengo los datos subyacentes sobre los que se calcularon las tasas.

2voto

getmizanur Puntos 290

Así pues, existen métodos para propagar el error a través de las operaciones aritméticas que se utilizan en muchas áreas de la ciencia. (por ejemplo, mire esto. )

Como el riesgo relativo es

$$R = \frac{X}{Y}, \text{with std. of } \sigma_x , \sigma_y$$

Nos interesa el error a través del operador divisor que es

$$\sigma_R = R\sqrt{\big(\frac{\sigma_x}{X}\big)^2 + \big(\frac{\sigma_y}{Y}\big)^2}$$

Sin embargo, si X e Y tienen una distribución gaussiana, R no lo será.

Editar:

Ejemplo

Ejemplo: Al inicio del estudio tengo una tasa estimada de 38,3 (IC 95%, 36,0-40,8) y en el grupo de estudio tengo una tasa estimada de 45,2 (IC 95%, 43,2-47,2). El riesgo relativo es de 1,18, pero ¿cuáles son los límites de confianza del 95%? No tengo los datos subyacentes sobre los que se calcularon las tasas.

$$R = 1.18$$

El intervalo de confianza del 95% es aproximadamente $2\sigma$ a cada lado, por lo que $\sigma_b = 1.25$ y $\sigma_s = 1$ . Así que entonces

$$\sigma_R = 1.18\sqrt{\big(\frac{1.25}{38.3}\big)^2 + \big(\frac{1}{45.2}\big)^2}$$

$$\sigma_R = 0.053$$

Así que el riesgo relativo es aproximadamente $1.18\pm0.1$ con un 95% de confianza.

1voto

user162986 Puntos 41

Un enfoque adicional consistiría en suponer que la distribución muestral del riesgo relativo logarítmico se distribuye normalmente. Aunque lo mismo ocurre con el riesgo relativo, el tamaño de la muestra debe ser mayor para que este hecho sea útil en la práctica. De hecho, suele ocurrir que la fórmula más utilizada para los intervalos de confianza del riesgo relativo (IC de Wald) hace esta suposición sobre el riesgo relativo logarítmico. Utilizando el ejemplo de OP, tenemos:

set.seed(12345) # For reproducibility
rr.a <- 38.3
rr.b <- 45.2
ci.a <- c(36, 40.8)
ci.b <- c(43.2, 47.2)

Podemos calcular las desviaciones estándar en la escala logarítmica. Serían la diferencia entre los intervalos de confianza logarítmicos dividida por aproximadamente 4. qnorm es la función cuantil de la distribución normal.

l.sd.a <- diff(log(ci.a)) / qnorm(.975) / 2
l.sd.b <- diff(log(ci.b)) / qnorm(.975) / 2

A continuación, suponemos que los riesgos relativos logarítmicos son normales con la media como el riesgo relativo logarítmico estimado y las desviaciones estándar como los valores anteriores. Podemos extraer un gran número de muestras asumiendo ambas distribuciones y luego tomar la diferencia entre ambas muestras.

nboots <- 1e4
log.rr.s <- rnorm(nboots, log(rr.b), l.sd.b) - rnorm(nboots, log(rr.a), l.sd.a)

Y para los resultados, los percentiles 2,5 y 97,5 exponenciados:

exp(quantile(log.rr.s, c(.025, .975)))
#     2.5%    97.5% 
# 1.094151 1.274278 

En el ejemplo específico de la OP, probablemente no suponga una diferencia, ya que los IC para el RR son en sí mismos simétricos. Esto es más probable cuando los RR son números enormes como en el ejemplo de OP.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X