1) Tenía un conjunto de datos con datos perdidos para las variables de referencia y las variables de resultado. Mediante imputación múltiple en el SPSS (10 imputaciones, 50 iteraciones, PMM para las variables de escala) imputé los datos que faltaban para las variables de referencia. Cuando analizo los datos (es decir, sólo los 10 conjuntos de datos imputados) y utilizo la prueba t de muestras independientes para una variable continua, los resultados se agrupan. Esto incluye la media y el valor p, pero no la desviación estándar. ¿Es correcto que pueda tomar la media de las 10 desviaciones estándar calculadas para los conjuntos de datos imputados para calcular la desviación estándar agrupada?
2) El valor p agrupado de la prueba t independiente sobre 10 conjuntos de datos de imputación en el SPSS no es la media de los 10 valores p que se calculan: ¿estoy en lo cierto? ¿Creo que se hace una corrección por el hecho de que el valor p se basa en datos imputados?
3) Quiero imputar los datos que faltan para las variables de resultado también. No incluí esas variables en el primer proceso de imputación, ya que una de las variables de resultado se ve afectada por el valor de una de las variables de referencia cuyos datos faltaban. Así que pensé que primero imputaría la variable de referencia, crearía un conjunto de datos "completo" para ella y luego imputaría las variables de resultado utilizando esos datos y las otras variables de referencia. ¿Es posible imputar una segunda vez? ¿Y cómo podría hacerlo? Ahora (después del primer proceso de imputación) tengo un conjunto de datos que es 11 veces más grande que el original (conjunto de datos original + 10 x conjunto de datos imputados). ¿Debo utilizar los 10 conjuntos de datos imputados para ejecutar de nuevo el proceso de imputación, lo que daría como resultado otro conjunto de datos diez veces mayor (es decir, 100 veces el tamaño de mi conjunto de datos original)? ¿Y es cierto que esto llevaría a una mayor desviación estándar para las variables de escala?