7 votos

Imputación múltiple con el paquete Amelia

Tengo una pregunta general sobre el Amelia paquete. No soy matemático ni estadístico, pero tuve que usar R e imputar y analizar algunos datos, y Amelia mostró resultados que se ajustaban a mis expectativas. Tendré que defender mi elección pronto, pero no he comprendido del todo lo que hace Amelia.

Estoy especialmente interesado en una explicación lo más sencilla posible de cómo funciona la imputación de Amelia. He leído que utiliza un algoritmo basado en el bootstrap, pero ¿cómo elige los valores?

Los datos tenían principalmente un valor >0 (concentraciones químicas, temperatura del agua y valor del pH).

14voto

Stef van Buuren Puntos 1130

Amelia asume que los datos siguen una distribución normal multivariante, por lo que toda la información sobre las relaciones en los datos puede resumirse sólo con medias y covarianzas. Cuando los datos son incompletos, Amelia utiliza el conocido algoritmo EM para encontrar estimaciones corregidas de las medias y covarianzas. Véase Little y Rubin (2002) para más detalles.

En su forma original, las estimaciones EM no pueden utilizarse para crear imputaciones múltiples, ya que las estimaciones no reflejan el hecho de que se han estimado a partir de una muestra finita. Para solucionar esto, Amelia toma primero m muestras bootstrap y aplica el algoritmo EM a cada una de estas muestras bootstrap. Las m estimaciones de medias y varianzas serán ahora diferentes. El primer conjunto de estimaciones se utiliza para extraer el primer conjunto de valores imputados mediante una forma de análisis de regresión, el segundo conjunto se utiliza para calcular el segundo conjunto de valores imputados, y así sucesivamente.

Como Amelia asume una distribución normal multivariante, funcionará mejor cuando sus datos se distribuyan aproximadamente de forma normal (posiblemente después de una transformación), y cuando los estadísticos que calcule a partir de los datos en su análisis de datos completos estén cerca del centro de la distribución, como las medias, las modas o los pesos de regresión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X