Tengo una variable de tratamiento categórica, MessageType, que tiene 12 valores diferentes. La variable de resultado, Crash, a veces determina estos valores. Así, un mayor número de choques conduce a ciertos tipos de mensajes, y un menor número de choques conduce a otros tipos de mensajes. Estoy interesado en estimar el efecto causal de cada tipo de mensaje sobre el número de colisiones, sin embargo, como el propio mensaje está determinado por el resultado, tengo un problema de endogeneidad. En mi regresión, estoy controlando diferentes factores (tráfico, clima, condiciones de la carretera, etc.) que pueden afectar al número de colisiones para conseguir algún tipo de independencia condicional. Sin embargo, creo que incluso después de controlar todas las covariables, la endogeneidad sigue existiendo, sobre todo en el caso de un tipo particular de mensaje, es decir, "Crash Ahead". Este mensaje está casi siempre determinado por el resultado y, por lo tanto, me da un gran efecto causal si se incluye en la regresión como otros tipos de mensajes.
La pregunta es ¿cuál es la mejor manera de manejar este tratamiento particular que está determinado por el resultado para obtener efectos de tratamiento consistentes para "CrashAhead" y otros tipos de mensajes? Estaba pensando en utilizar un retardo del resultado como instrumento, pero no parece un buen instrumento, ya que no satisface la restricción de exclusión. Mi modelo de referencia es de efectos fijos de Poisson y tengo un panel largo (T grande, N pequeño).