4 votos

¿Por qué el error estándar de los ratios no tiene registro?

La fórmula del SE de los coeficientes de riesgo: $\sqrt{1/a - 1/(a+c) + 1/b - 1/(b+d)}$ Dónde a+c es el grupo1 y b+d es el grupo2. Luego, para el intervalo de confianza, sumamos/resta el resultado a/del logaritmo natural de la proporción.

Mientras que el ratio se expresa en log, ¿por qué el SE no se expresa en log? ¿Cómo se ha llegado a la fórmula mencionada? No he podido encontrar ningún profe en Internet, no quiero darlo por hecho :)

12voto

mehturt Puntos 13

Aquí está la derivación. Utilizo la misma notación que en esta presentación (a partir de la página 29). Veamos el conocido $2\times2$ -Tabla de abajo.

2x2 Table

El riesgo relativo o ratio de riesgo se define como $$ \theta=\mathrm{RR}=\dfrac{\dfrac{p_{11}}{p_{11}+p_{12}}}{\dfrac{p_{21}}{p_{21}+p_{22}}}=\dfrac{p_{11}\cdot (p_{21}+p_{22})}{p_{21}\cdot (p_{11}+p_{12})} $$ Queremos derivar la varianza de $\theta$ . La versión multivariable del método delta es: $$ \mathrm{Var}(\hat{\theta})\approx \nabla f(p_{11}, p_{12}, p_{21}, p_{22})\cdot \mathrm{Cov}(p_{11}, p_{12}, p_{21}, p_{22})\cdot \nabla f(p_{11}, p_{12}, p_{21}, p_{22})^{T} $$ Dónde $\nabla$ es el vector de gradiente. Eso es: $$ \nabla f(p_{11}, p_{12}, p_{21}, p_{22}) = \left(\frac{\partial f}{\partial\,p_{11}}, \ldots,\frac{\partial f}{\partial\,p_{22}}\right) $$ Queremos estimar $$ \mathrm{Var}(\log(\mathrm{RR}))=\mathrm{Var}\left[\log\left(\frac{p_{11}\cdot (p_{21}+p_{22})}{p_{21}\cdot (p_{11}+p_{12})}\right)\right] $$ Que la función $f$ sea $$ f = \left[\log(p_{11}) + \log(p_{21}+p_{22}) - \log(p_{21}) - \log(p_{11}+p_{12})\right] $$ El gradiente $\nabla f$ es $$ \nabla f = \left(\frac{p_{12}}{p_{11}^{2}+p_{11}p_{12}},-\frac{1}{p_{11}+p_{12}},-\frac{p_{22}}{p_{21}^{2}+p_{21}p_{22}}, \frac{1}{p_{21}+p_{22}}\right) $$ La matriz de covarianza de la varianza para una distribución multinomial con $c=4$ categorías es $$ \Sigma=\frac{1}{n}\left( \begin{array}{cccc} \left(1-p_{11}\right) p_{11} & -p_{11} p_{12} & -p_{11} p_{21} & -p_{11} p_{22} \\ -p_{11} p_{12} & \left(1-p_{12}\right) p_{12} & -p_{12} p_{21} & -p_{12} p_{22} \\ -p_{11} p_{21} & -p_{12} p_{21} & \left(1-p_{21}\right) p_{21} & -p_{21} p_{22} \\ -p_{11} p_{22} & -p_{12} p_{22} & -p_{21} p_{22} & \left(1-p_{22}\right) p_{22} \\ \end{array} \right) $$ Entonces $\nabla f\,\Sigma$ es igual a $$ \nabla f\,\Sigma=\frac{1}{n}\times \left[\frac{p_{12}}{p_{11}+p_{12}}, -\frac{p_{12}}{p_{11}+p_{12}}, -\frac{p_{22}}{p_{21}+p_{22}}, \frac{p_{22}}{p_{21}+p_{22}}\right] $$ Ahora necesitamos $(\nabla f\,\Sigma)\times \nabla f^{T}$ que es igual: $$ (\nabla f\,\Sigma)\times \nabla f^{T}=\frac{1}{n}\times \left[-\frac{1}{p_{11}+p_{12}}+\frac{1}{p_{21}}-\frac{1}{p_{21}+p_{22}}+\frac{1}{p_{11}}\right] $$ Sustituyendo las MLEs para $\widehat{p_{ij}}=n_{ij}/n$ Finalmente, el resultado es $$ \widehat{\mathrm{Var}(\log(\mathrm{RR})}=\left(\frac{1}{n_{11}}+\frac{1}{n_{21}}\right)-\left(\frac{1}{n_{11}+n_{12}}+\frac{1}{n_{21}+n_{22}}\right) $$ Así, el error estándar aproximado para el riesgo relativo en la escala logarítmica es $$ \widehat{\mathrm{SE}(\log(\mathrm{RR})}=\sqrt{\widehat{\mathrm{Var}(\log(\mathrm{RR})}}=\sqrt{\left(\frac{1}{n_{11}}+\frac{1}{n_{21}}\right)-\left(\frac{1}{n_{11}+n_{12}}+\frac{1}{n_{21}+n_{22}}\right)} $$ Por tanto, un intervalo de confianza aproximado de dos caras de nivel $\alpha$ para el riesgo relativo en la escala original es $$ \mathrm{CI}=\exp(\log(\mathrm{RR})\pm z_{1-\alpha/2}\times \mathrm{SE}(\log(\mathrm{RR})) $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X