Me preocupa el problema de que me gustaría hacer un bootstrap del valor p para una estimación de $\theta$ a partir de datos de imputación múltiple (IM), pero no tengo claro cómo combinar los valores p entre los conjuntos de IM.
Para los conjuntos de datos de IM, el enfoque estándar para llegar a la varianza total de las estimaciones utiliza las reglas de Rubin. Véase aquí para una revisión de la agrupación de conjuntos de datos de IM. La raíz cuadrada de la varianza total sirve como estimación del error estándar de $\theta$ . Sin embargo, para algunos estimadores la varianza total no tiene una forma cerrada conocida o la distribución muestral no es normal. El estadístico ${\theta}/{se(\theta)}$ puede entonces no estar distribuido en t, ni siquiera asintóticamente.
Por lo tanto, en el caso de los datos completos, una opción alternativa es realizar un bootstrap de la estadística para encontrar la varianza, un valor p y un intervalo de confianza, incluso si la distribución de la muestra no es normal y se desconoce su forma cerrada. En el caso de los IM hay entonces dos opciones:
- Agrupar la varianza de los conjuntos de datos de las IM.
- Agrupar el valor p o los límites de confianza en los conjuntos de datos de los IM
La primera opción volvería a utilizar las reglas de Rubin. Sin embargo, creo que esto es problemático, si $\theta$ tiene una distribución de muestreo no normal. En esta situación (o, en general, en todas las situaciones), el valor p de bootstrap puede utilizarse directamente. Sin embargo, en el caso de los IM, esto daría lugar a múltiples valores p o intervalos de confianza, que deben agruparse entre los conjuntos de datos de los IM.
Así que mi pregunta es: ¿cómo debo agrupar múltiples valores p (o intervalos de confianza) de bootstrap a través de conjuntos de datos imputados múltiples?
Agradecería cualquier sugerencia sobre cómo proceder, gracias.