Tengo un conjunto de datos longitudinales de individuos y algunos de ellos fueron sometidos a un tratamiento y otros no. Todos los individuos están en la muestra desde el nacimiento hasta los 18 años y el tratamiento tiene lugar a una edad intermedia. La edad del tratamiento puede variar de un caso a otro. Utilizando el emparejamiento por puntuación de propensión, me gustaría emparejar las unidades tratadas y de control por parejas con un emparejamiento exacto en el año de nacimiento, de forma que pueda realizar un seguimiento de cada pareja desde su año de nacimiento hasta los 18 años. En total, hay unos 150 individuos tratados y 4.000 no tratados. Tras el emparejamiento, la idea es utilizar una estrategia de diferencias en diferencias para estimar el efecto del tratamiento.
El problema al que me enfrento en este momento es hacer el emparejamiento con datos de panel. Estoy utilizando el psmatch2
command y yo emparejamos las características de los hogares y de los individuos mediante propensity score matching. En general, con datos de panel habrá diferentes emparejamientos óptimos a cada edad. Por ejemplo: si A es tratado, B y C son controles, y todos ellos nacieron en 1980, entonces A y B pueden ser emparejados en 1980 a la edad 0 mientras que A y C son emparejados en 1981 a la edad 1 y así sucesivamente. También A puede emparejarse con sus propios valores anteriores al tratamiento de años anteriores.
Para evitar este problema, he tomado la media de todas las variables que varían con el tiempo, de forma que el emparejamiento pueda identificar a los individuos que son, por término medio, los más parecidos a lo largo de la muestra, y hago el emparejamiento por separado para cada grupo de edad de 0 a 18 años. Desgraciadamente, de este modo se sigue emparejando una unidad de control diferente con cada unidad tratada por grupo de edad.
Si alguien pudiera indicarme un método para realizar emparejamientos por pares con datos de panel en Stata, se lo agradecería mucho.