2 votos

¿Imputar los datos que faltan de una variable en un conjunto de datos longitudinales?

Tengo un conjunto de datos longitudinales con tres variables: FIPS, eighteenplus y año. FIPS es el id , y me gustaría imputar datos para eighteenplus.

Los datos de Eighteenplus sólo estaban disponibles para 1990 y 2000, por lo que me gustaría imputar los datos de cada año FIPS del periodo 1991-1999. Sin embargo, he ejecutado este código...

master_miced = mice(master, m=5, method = 'pmm', seed=14)

...que devolvió los siguientes valores imputados (un subconjunto para un FIPS). Los valores de 1990 y 2000 son 1.697.527 y 1.802.827 respectivamente, pero el mice devuelve valores inferiores en órdenes de magnitud en algunos casos.

FIPS    eighteenplus    year
36047   1697527         1990
36047   51728           1991
36047   25844           1992
36047   40584           1993
36047   3916            1994
36047   3606            1995
36047   35620           1996
36047   148214          1997
36047   46370           1998
36047   44641           1999
36047   1802827         2000

¿Alguna idea de dónde me estoy equivocando? Es la primera vez que utilizo mice . Parece que el cálculo de la concordancia de la media predictiva se basa en el conjunto de datos en general, en lugar de adaptar el cálculo a cada FIPS.

1voto

Zolomon Puntos 250

Si tu problema es imputar datos de series temporales, creo que podrías intentarlo:

  1. Un paquete R especializado, como Amelia.
  2. Plantear el problema en forma de espacio de estados, si se presta a tal tratamiento e interpolar utilizando el suavizador de simulación (véase por ejemplo simulateSSM en el paquete R KFAS ). Para la teoría, el libro de Durbin-Koopman es un recurso excelente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X