3 votos

Cómo tratar la variable de tratamiento que está determinada por la variable de resultado

Tengo una variable de tratamiento categórica, MessageType, que tiene 12 valores diferentes. La variable de resultado, Crash, a veces determina estos valores. Así, un mayor número de choques conduce a ciertos tipos de mensajes, y un menor número de choques conduce a otros tipos de mensajes. Estoy interesado en estimar el efecto causal de cada tipo de mensaje sobre el número de colisiones, sin embargo, como el propio mensaje está determinado por el resultado, tengo un problema de endogeneidad. En mi regresión, estoy controlando diferentes factores (tráfico, clima, condiciones de la carretera, etc.) que pueden afectar al número de colisiones para conseguir algún tipo de independencia condicional. Sin embargo, creo que incluso después de controlar todas las covariables, la endogeneidad sigue existiendo, sobre todo en el caso de un tipo particular de mensaje, es decir, "Crash Ahead". Este mensaje está casi siempre determinado por el resultado y, por lo tanto, me da un gran efecto causal si se incluye en la regresión como otros tipos de mensajes.

La pregunta es ¿cuál es la mejor manera de manejar este tratamiento particular que está determinado por el resultado para obtener efectos de tratamiento consistentes para "CrashAhead" y otros tipos de mensajes? Estaba pensando en utilizar un retardo del resultado como instrumento, pero no parece un buen instrumento, ya que no satisface la restricción de exclusión. Mi modelo de referencia es de efectos fijos de Poisson y tengo un panel largo (T grande, N pequeño).

1voto

B.Liu Puntos 289

He aquí una respuesta parcial: para cualquier momento en el tiempo $t$ Piensa en los resultados en $t$ los mensajes en $t+1,$ y los resultados en $t+2,$ así:

enter image description here

Obviamente, este diagrama no tiene en cuenta el tráfico, el tiempo y las condiciones de la carretera.

Lo que este diagrama está diciendo (y podemos alterar el diagrama fácilmente para adaptarlo a su modelo mental) es que el resultado en $t$ influye en los mensajes en $t+1$ y los resultados en $t+2,$ y los mensajes en $t+1$ sólo influyen en el resultado a $t+2.$

A continuación, podrías tomar este modelo para establecer tu regresión. Tenga en cuenta que no estoy considerando el retraso como una variable instrumental. El diagrama anterior es más bien un diagrama de confusión directa, donde, tal vez, la fórmula de ajuste de la puerta trasera podría ser útil: $$P(O(t+2)|\operatorname{do}(M(t+1)))=\sum_{O(t)}P(O(t+2)|M(t+1),O(t))\,P(O(t)).$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X