4 votos

Estacionalidad del tratamiento y efecto medio del tratamiento.

He de datos de panel de las ventas de muchas tiendas en dos ciudades comparables. Una de las ciudades es un evento especial una vez al mes (el tratamiento), que se espera aumentar las ventas a través de la junta en ese día. Me gustaría estimar el efecto medio del tratamiento sobre los tratados, es decir, identificar si es o no el evento especial que hace lo que debe.

Mientras que las dos ciudades son muy similares (y no puedo encontrar una serie de controles para las tiendas), el muestreo está claro que no es al azar. Además, hay autocorrelación en las ventas entre fechas en que cada individuo de la tienda, y parece razonable pensar que la estacionalidad mensual del tratamiento tiene algún impacto.

Mi pregunta es doble.

1/ ¿crees que ejecuta una diferencia-en-diferencias de análisis en este "experimental" el programa de instalación hace sentido?
2/ Los ejemplos de diff-en-diffs que he visto son todos los pre-tratamiento, post-tratamiento. ¿Tiene usted alguna idea de cómo me podría dar cuenta de la periodicidad del tratamiento? Me parece mal que considerar cada mes por separado, porque de la autocorrelación.

Muchas gracias por su ayuda!

1voto

simmosn Puntos 304

Deje $y_{ct}$ ser el resultado en la ciudad de c en el tiempo t, $x_{ct}$ ser una ciudad específica de la variable en el tiempo t, $z_t$ ser un no-específica de la ciudad de variable en el tiempo t (por ejemplo, día de la semana), y $T_{ct}$ ser el tratamiento del indicador (por ejemplo, boolean). Para las ciudades a y B, $$\begin{align*}y_{at} &= \alpha_a + \beta_a x_{ct} + \gamma_a z_t + \delta T_{at} + \epsilon_{at} \\ y_{bt} &= \alpha_b + \beta_a x_{bt} + \gamma_a z_t + \delta T_{bt} + \epsilon_{bt} \end{align*}$$ Asumir que la ciudad fue tratada, mientras que la ciudad de B no fue. Veamos la diferencia: $$\begin{equation*} y_{at} - y_{bt} = (\alpha_a - \alpha_b) + \beta_a x_{at} + (- \beta_b) x_{bt} + (\gamma_a - \gamma_b) z_t + \delta T_{at} + (\epsilon_{at} - \epsilon_{bt}) \end{equation*}$$ ¿Cuál es la magia de la diferencia-en-diferencias?

  • Supongamos que $x$ es inobservable. Si $\beta_a x_{at} = \beta_b x_{bt}$, por ejemplo, si las ciudades tienen el mismo valor de la covariable y el mismo efecto de la covariable, entonces esto no se ve factor cancela.
  • Supongamos que $z$ es inobservable. Si $\gamma_a = \gamma_b$, este término se retira.

Estas características son la razón por la que estamos interesados en la búsqueda de ciudades comparables---componentes no observables se supone que es el mismo en todas las ciudades y se cancelan.

(Nota: esta es una sola diferencia. ¿Dónde está la diferencia? Nos preocupamos por $\delta$, que es la diferencia entre el no-tratamiento y períodos de tratamiento.)

Ahora, sólo nos queda averiguar qué hacer con los términos de error. Si pensamos que $y$ tiene una unidad de raíz, debemos usar $\Delta y_{ct}$ en lugar de $y_{ct}$ desde el principio. Hacer un Dickey-Fuller o de la prueba KPSS en cada ciudad $y$ serie a averiguar.

De lo contrario, debemos referirnos a este artículo: ¿Cuánto Tenemos la Confianza de las Diferencias-en-Diferencias de las Estimaciones? por Bertrand, Duflo, y Mullainathan. El colapso de sus datos en un antes y después de la manera que realmente ayuda a aliviar la autocorrelación, el opuesto de su intuición. Mejores maneras de involucrar a los archivos de inicio o agrupado los errores estándar.

0voto

Peter Puntos 1

Advertencia 1: acabo de empezar a meterse en modelos de efectos mixtos, así que estoy un poco preocupada tengo más-la búsqueda de aplicaciones para este tipo de método. Estoy familiarizado con el nlme y lme4 paquetes, y no podía ser de un paquete mejor que aquellos que no estoy familiarizado con. Advertencia 2: no tengo mucho de llamada en mi trabajo para el montaje de modelos anidados, doy la bienvenida a un más experimentado de la persona para comprobar mi sugerencia a continuación, y proporcionar retroalimentación como puedo aprender de eso.

Yo estaba pensando lo largo de las líneas de tratar lineal enfoque de métodos mixtos. Usted necesita para comprobar los supuestos de normalidad para los datos de ventas, pero estos métodos significa que usted podría caber la tienda como un efecto aleatorio, que tenga en cuenta las medidas repetidas de aspecto de los datos.

Como usted tiene un diseño anidado, tal vez un modelo como este, podría funcionar:

DailySales$ ~ [store size] + [weekend/holiday indicator] + [city indicator] + [treatment indicator] + (1|[city indicator]/[store ID])

Este modelo sugiere montaje de la tienda como un efecto aleatorio agrupan dentro de la ciudad (el último término).

Eche un vistazo a la lme4 paquete en R, y en el lmer opción. No estoy seguro de si todas las tiendas tienen el mismo número de horas de apertura, y si algunas de las tiendas están abiertas más tiempo que otros, que puede ser otra variable de ajuste.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X