18 votos

Ajuste por puntuación de la propensión con datos de panel

Tengo un conjunto de datos longitudinales de individuos y algunos de ellos fueron sometidos a un tratamiento y otros no. Todos los individuos están en la muestra desde el nacimiento hasta los 18 años y el tratamiento tiene lugar a una edad intermedia. La edad del tratamiento puede variar de un caso a otro. Utilizando el emparejamiento por puntuación de propensión, me gustaría emparejar las unidades tratadas y de control por parejas con un emparejamiento exacto en el año de nacimiento, de forma que pueda realizar un seguimiento de cada pareja desde su año de nacimiento hasta los 18 años. En total, hay unos 150 individuos tratados y 4.000 no tratados. Tras el emparejamiento, la idea es utilizar una estrategia de diferencias en diferencias para estimar el efecto del tratamiento.

El problema al que me enfrento en este momento es hacer el emparejamiento con datos de panel. Estoy utilizando el psmatch2 command y yo emparejamos las características de los hogares y de los individuos mediante propensity score matching. En general, con datos de panel habrá diferentes emparejamientos óptimos a cada edad. Por ejemplo: si A es tratado, B y C son controles, y todos ellos nacieron en 1980, entonces A y B pueden ser emparejados en 1980 a la edad 0 mientras que A y C son emparejados en 1981 a la edad 1 y así sucesivamente. También A puede emparejarse con sus propios valores anteriores al tratamiento de años anteriores.

Para evitar este problema, he tomado la media de todas las variables que varían con el tiempo, de forma que el emparejamiento pueda identificar a los individuos que son, por término medio, los más parecidos a lo largo de la muestra, y hago el emparejamiento por separado para cada grupo de edad de 0 a 18 años. Desgraciadamente, de este modo se sigue emparejando una unidad de control diferente con cada unidad tratada por grupo de edad.

Si alguien pudiera indicarme un método para realizar emparejamientos por pares con datos de panel en Stata, se lo agradecería mucho.

10voto

user18644 Puntos 76

Básicamente, tiene que crear un conjunto de datos de formato amplio con todas las características relevantes para el procedimiento de emparejamiento, realizar el emparejamiento en este conjunto de datos transversal y, a continuación, utilizar el ID para identificar el par emparejado en el conjunto de datos de panel. Aquí tiene más detalles:

  1. Utilice reshape para crear un conjunto de datos de gran formato. Formatee las variables de pretratamiento del modo en que desee utilizarlas en el procedimiento de emparejamiento. Puede limitarse a tomar la media de sus variables si tiene múltiples observaciones para un individuo, pero también puede idear otras formas (también puede mantener múltiples observaciones de las mismas variables como salud1, salud2 y utilizarlas todas en el emparejamiento). El objetivo es tener un conjunto de datos con una observación por individuo .

  2. Utilizando este conjunto de datos, realice el procedimiento de emparejamiento con psmatch2 .

  3. Fusionar la información sobre los casos emparejados con el conjunto de datos original. Eliminar los casos no coincidentes, etc. No estoy seguro de los detalles porque no conozco bien stata y psmatch2 pero creo que captas la idea.

Siguiendo estos pasos, podrá emparejar los casos basándose en toda la información previa al tratamiento y sólo tendrá un emparejamiento por unidad de tratamiento.

5voto

Neal Puntos 316

No hay forma de hacerlo en Stata ni en cualquier otro software que yo sepa.

Si está intentando arreglar un estimador de emparejamiento sesgado con técnicas de datos de panel, he aquí un enfoque que puede funcionar. Si puede suponer que el emparejamiento elimina parte del sesgo de selección, pero no todo, pero que el sesgo permanece constante a lo largo del tiempo, puede eliminar la parte del sesgo que no varía con el tiempo construyendo estimaciones de emparejamiento separadas en cada periodo y tomando la diferencia.

Sea $t$ es el período anterior al tratamiento y $t'$ sea el puesto. Si el resultado del estado no tratado $Y_0$ satisface

\begin{equation} E[Y_{0t} \vert X, D=1]-E[Y_{0t} \vert X, D=0]=E[Y_{0t'} \vert X, D=1]-E[Y_{0t'} \vert X, D=0]=Bias, \end{equation} entonces si $\Delta^{M}_{t'}=\Delta^{TT}+Bias$ y $\Delta^{M}_{t}=Bias$ , puede obtener $\Delta^{M}_{t'}-\Delta^{M}_{t}=\Delta^{TT}$

Heckman, Ichimura, Smith y Todd 1998 Econometrica y Eichler y Lechner 2002 Economía laboral son ejemplos de este enfoque. Por otro lado, 150 observaciones tratadas pueden no ser suficientes para que este enfoque funcione.

0voto

user121427 Puntos 11

Pasos:

  1. Como ha mencionado Greg en detalle, puede utilizar un conjunto de datos transversales, ya sea sobre las medias anteriores al tratamiento o sobre un periodo específico anterior al tratamiento para generar la correspondencia.

  2. Utilizando todo el panel se asignan variables indicadoras para
    a. individuo tratado
    b. treatedPeriod, este último es igual a cero en cuanto se produce el tratamiento para el treatedIndividual.

    Dado que el punto en el tiempo en el que treatedPeriod cambia de 0 a 1 varía entre los individuos y nunca se convierte en 1 para untreated debe asignar el mismo punto de partida de la coincidencia treated a la coincidencia untreated. Esto es intuitivo pero me gustaría ver una buena referencia que justifique este enfoque que no he encontrado hasta ahora.

La configuración de la regresión sería:

depvar = treatedIndvidual + treatedPeriod  + treatedIndvidual*treatedPeriod + controls

donde el término de interacción proporciona el efecto del tratamiento.

-3voto

¿Ha pensado en utilizar el nnmatch ¿Mando?

Yo uso este comando y es bastante completo. Tiene en cuenta diferentes algoritmos de emparejamiento y también casos en los que la puntuación de propensión es la misma para algunos individuos del grupo de control. Por supuesto, el tratamiento de este caso depende del algoritmo de emparejamiento, si se toma k-nearest-neighbour o kernel o lo que sea.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X