3 votos

Varianza combinada tras imputación múltiple con modelo de supervivencia

He creado 5 imputaciones de un conjunto de datos y he ajustado un modelo de supervivencia a todos ellos en R. Quiero combinar las estimaciones de los coeficientes y los errores estándar de los coeficientes. Para ello he tomado la media de los coeficientes y he combinado los errores estándar utilizando la fórmula de Rubins, es decir $$(1+1/m) \times \text{between imputation variance} + \text{within imputation variance}$$

Estaba pensando en ello y tengo algunas dudas sobre si esto tiene sentido? ¿No se sobreestimaría la varianza en este caso? He realizado una prueba t sobre los coeficientes y da como resultado un valor p relativamente alto cuando sé que los datos deberían mostrar una buena correlación. Utilizo la fórmula Rubins df para la prueba t. ¿Existe un método alternativo para producir la varianza combinada, uno que no resulte en una sobreestimación?

1voto

Jonathan Bartlett Puntos 151

No sé por qué crees que el estimador de la varianza de Rubin está sesgado al alza. En ciertas situaciones (por ejemplo, el imputador asume menos que el analista, véase http://www.stat.harvard.edu/Faculty_Content/meng/StatSci94.pdf ) puede tener un sesgo al alza, pero en estos casos la imputación múltiple sigue siendo el enfoque más práctico para tratar la falta de datos. El documento anterior ofrece un análisis minucioso de las condiciones en las que el estimador de la varianza de Rubin es insesgado, y cuando sobrestima la varianza.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X