El hecho de que esto es aproximadamente una distribución normal se basa en el teorema del límite central (CLT), por lo que será una mejor aproximación en muestras grandes. El CLT funciona mejor para el registro de cualquier relación (riesgo relativo, odds ratio, razón de riesgo..) que para la relación en sí.
Debidamente muestras grandes, creo que esta es una buena aproximación a la varianza en dos situaciones:
- El peligro en cada grupo es constante en el tiempo (independientemente de la razón de riesgo)
- El supuesto de proporcionalidad de riesgos tiene y la relación de riesgo es cercano a 1
Creo que puede convertirse en un tosco supuesto, en situaciones muy lejos de estos, es decir, si los riesgos varían considerablemente con el tiempo y el cociente de riesgo está lejos de 1. Si puedes hacerlo mejor depende de qué información está disponible. Si usted tiene acceso a la totalidad de los datos se puede ajustar un modelo de riesgos proporcionales y obtener la varianza del log hazard ratio de eso. Si sólo tenemos la información en un artículo publicado, varias otras aproximaciones han sido desarrollados por meta-analistas. Estas dos referencias son tomadas de la Cochrane Handbook:
- M. K. B. Parmar, V. Torri, y L. Stewart (1998). "La extracción de las estadísticas de resumen para realizar el meta-análisis de la literatura publicada para la supervivencia de los extremos." La estadística en Medicina 17 (24):2815-2834.
- Paula R. Williamson, Catrin Tudur Smith, Jane L. Hutton, y Anthony G. Marson. "Agregado meta-análisis de datos con el tiempo-para-eventos de los resultados". La estadística en Medicina 21 (22):3337-3351, 2002.
En Parmar et al, la expresión dar seguiría de uso observado números en lugar de la esperada en su ecuación (5), o la combinación de las ecuaciones (6) y (12). Las ecuaciones (5) y (6) se basa en el rango logarítmico métodos. A los que hacen referencia Kalbfleisch Y Prentice para la ecuación (12), pero no la tengo a mano, así que tal vez alguien que no puede comprobar y agregar a esto.