Una buena característica de la diferencia en diferencias (DiD) es que no se necesitan datos de panel para ello. Dado que el tratamiento se produce en algún tipo de nivel de agregación (en su caso, las ciudades), sólo es necesario tomar muestras aleatorias de individuos de las ciudades antes y después del tratamiento. Esto le permite estimar $$ y_{ist} = A_g + B_t + \beta D_{st} + c X_{ist} + \epsilon_{ist} $$ y obtener el efecto causal del tratamiento como la diferencia esperada del resultado posterior al tratamiento menos la diferencia esperada del resultado posterior al control.
Hay un caso en el que la gente utiliza efectos fijos individuales en lugar de un indicador de tratamiento y es cuando no tenemos un nivel de agregación bien definido en el que se produce el tratamiento. En ese caso se estimaría $$ y_{it} = \alpha_i + B_t + \beta D_{it} + cX_{it}+\epsilon_{it} $$ donde $D_{it}$ es un indicador del periodo posterior al tratamiento para los individuos que lo han recibido (por ejemplo, un programa de mercado de trabajo que ocurre en todas partes). Para más información al respecto, véase notas de clase por Steve Pischke.
En su entorno, añadir efectos fijos individuales no debería cambiar nada con respecto a las estimaciones puntuales. El indicador de tratamiento $A_g$ sólo serán absorbidos por los efectos fijos individuales. Sin embargo, estos efectos fijos podrían absorber parte de la varianza residual y, por tanto, reducir potencialmente el error estándar de su coeficiente DiD.
A continuación se muestra un ejemplo de código que demuestra que este es el caso. Yo utilizo Stata, pero usted puede reproducirlo en el paquete estadístico de su elección. Los "individuos" aquí son en realidad países, pero siguen estando agrupados según algún indicador de tratamiento.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Así, se ve que el coeficiente DiD sigue siendo el mismo cuando se incluyen los efectos fijos individuales ( areg
es uno de los comandos de estimación de efectos fijos disponibles en Stata). Los errores estándar son ligeramente más ajustados y nuestro indicador de tratamiento original fue absorbido por los efectos fijos individuales y, por lo tanto, se eliminó de la regresión.
En respuesta al comentario
Mencioné el ejemplo de Pischke para mostrar cuando la gente utiliza efectos fijos individuales en lugar de un indicador de grupo de tratamiento. Su escenario tiene una estructura de grupo bien definida, por lo que la forma en que ha escrito su modelo está perfectamente bien. Los errores estándar deberían agruparse a nivel de ciudad, es decir, el nivel de agregación en el que se produce el tratamiento (no lo he hecho en el código del ejemplo, pero en los ajustes de DiD los errores estándar deben corregirse, como se demuestra en el artículo de Bertrand et al).
En cuanto a los promotores, no tienen mucho que hacer aquí. El indicador de tratamiento $D_{st}$ es igual a 1 para las personas que viven en una ciudad tratada $s$ en el periodo posterior al tratamiento $t$ . Para calcular el coeficiente DiD, en realidad sólo tenemos que calcular cuatro expectativas condicionales, a saber $$ c = \left[ E(y_{ist}|s=1,t=1) - E(y_{ist}|s=1,t=0)\right] - \left[ E(y_{ist}|s=0,t=1) - E(y_{ist}|s=0,t=0)\right] $$
Por lo tanto, si tiene 4 periodos posteriores al tratamiento para un individuo que vive en una ciudad tratada durante los dos primeros, y luego se traslada a una ciudad de control durante los dos periodos restantes, las dos primeras de esas observaciones se utilizarán en el cálculo de $E(y_{ist}|s=1,t=1)$ y los dos últimos en $E(y_{ist}|s=0,t=1)$ . Para que quede claro por qué la identificación proviene de las diferencias del grupo a lo largo del tiempo y no de los que se mueven, se puede visualizar esto con un simple gráfico. Supongamos que el cambio en el resultado se debe realmente sólo al tratamiento y que éste tiene un efecto contemporáneo. Si tenemos un individuo que vive en una ciudad tratada después del inicio del tratamiento, pero que luego se traslada a una ciudad de control, su resultado debería volver a ser el que tenía antes de ser tratado. Esto se muestra en el siguiente gráfico estilizado.
Sin embargo, es posible que quiera pensar en las mudanzas por otras razones. Por ejemplo, si el tratamiento tiene un efecto duradero (es decir, sigue afectando al resultado aunque la persona se haya mudado)
0 votos
Si quiere capturar los efectos de las variables ficticias de las entidades, ¿por qué no hacer un modelo de efectos fijos? DID es equivalente a FE con 2 periodos de tiempo, por lo que incluir dummies y luego hacer DID haría que se perdieran.
0 votos
Corríjame si me equivoco, pero veo dos diferencias: a) un modelo de fe utilizaría una comparación dentro de la unidad para estimar el efecto (por ejemplo, si los ingresos son mayores o menores después de un determinado acontecimiento vital). La idea de un enfoque DiD es utilizar otras observaciones como tendencia de control para captar lo que habría ocurrido sin el tratamiento. b) DiD se centra en un tratamiento a nivel de grupo y no a nivel individual. Ahora la pregunta es qué ocurre si añado un término de alimentación a nivel individual a la ecuación de mi ejemplo. ¿Utiliza eso las observaciones de control como tendencia de control? Aunque todos los obs de control no varían con el tratamiento...