Cómo tratar la variable de tratamiento que está determinada por la variable de resultado

Question

Cómo tratar la variable de tratamiento que está determinada por la variable de resultado

Preguntado el 25 de Mayo, 2020: Cuando se hizo la pregunta
85 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo una variable de tratamiento categórica, MessageType, que tiene 12 valores diferentes. La variable de resultado, Crash, a veces determina estos valores. Así, un mayor número de choques conduce a ciertos tipos de mensajes, y un menor número de choques conduce a otros tipos de mensajes. Estoy interesado en estimar el efecto causal de cada tipo de mensaje sobre el número de colisiones, sin embargo, como el propio mensaje está determinado por el resultado, tengo un problema de endogeneidad. En mi regresión, estoy controlando diferentes factores (tráfico, clima, condiciones de la carretera, etc.) que pueden afectar al número de colisiones para conseguir algún tipo de independencia condicional. Sin embargo, creo que incluso después de controlar todas las covariables, la endogeneidad sigue existiendo, sobre todo en el caso de un tipo particular de mensaje, es decir, "Crash Ahead". Este mensaje está casi siempre determinado por el resultado y, por lo tanto, me da un gran efecto causal si se incluye en la regresión como otros tipos de mensajes.

La pregunta es ¿cuál es la mejor manera de manejar este tratamiento particular que está determinado por el resultado para obtener efectos de tratamiento consistentes para "CrashAhead" y otros tipos de mensajes? Estaba pensando en utilizar un retardo del resultado como instrumento, pero no parece un buen instrumento, ya que no satisface la restricción de exclusión. Mi modelo de referencia es de efectos fijos de Poisson y tengo un panel largo (T grande, N pequeño).

Preguntado el 25 de Mayo, 2020 por MegaByter

Answer 1

1 Respuestas

Answer 2

1voto

B.Liu Puntos 289

He aquí una respuesta parcial: para cualquier momento en el tiempo $t$ Piensa en los resultados en $t$ los mensajes en $t+1,$ y los resultados en $t+2,$ así:

Obviamente, este diagrama no tiene en cuenta el tráfico, el tiempo y las condiciones de la carretera.

Lo que este diagrama está diciendo (y podemos alterar el diagrama fácilmente para adaptarlo a su modelo mental) es que el resultado en $t$ influye en los mensajes en $t+1$ y los resultados en $t+2,$ y los mensajes en $t+1$ sólo influyen en el resultado a $t+2.$

A continuación, podrías tomar este modelo para establecer tu regresión. Tenga en cuenta que no estoy considerando el retraso como una variable instrumental. El diagrama anterior es más bien un diagrama de confusión directa, donde, tal vez, la fórmula de ajuste de la puerta trasera podría ser útil: $$P(O(t+2)|\operatorname{do}(M(t+1)))=\sum_{O(t)}P(O(t+2)|M(t+1),O(t))\,P(O(t)).$$

Respondido el 3 de Junio, 2020 por B.Liu (289 Puntos )

Cómo tratar la variable de tratamiento que está determinada por la variable de resultado

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Cómo tratar la variable de tratamiento que está determinada por la variable de resultado

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: