3 votos

Uso de los residuos en la regresión 2SLS para eliminar la causalidad inversa

Alguien me sugirió la siguiente idea para controlar la causalidad inversa. Supongamos que queremos comprobar el efecto de $X$ en $Y$ en un conjunto de datos de panel, pero sospechamos que existe una causalidad inversa. Es decir, los valores pasados de $Y$ puede causar variaciones en $X$ También.

La sugerencia es la siguiente: Para eliminar la posible causalidad inversa entre la variable independiente $X_t$ y la variable dependiente $Y_t$ podríamos realizar una regresión de primera etapa del segundo retardo de $y$ en el primer retraso de $x$ ,

$$x_{t-1}=\alpha + \beta y_{t-2} + e_{t-1}$$

y luego utilizar los residuos de esa regresión $e_{t-1}$ como variable independiente en nuestro modelo principal

$$y_t = \beta_0 + e_{t-1} + z_{t-1}$$

Aquí, $e_{t-1}$ representaría así la parte de $x_{t-1}$ que no se explica por los valores anteriores de $y$ . Por lo tanto, este método debería eliminar eficazmente la causalidad inversa en el modelo.

La propuesta tiene un sentido intuitivo, al menos para mí. Sin embargo, no he visto que se proponga o aplique en ningún sitio antes, ya que el remedio común para la causalidad inversa es 1) retrasar las variables independientes, y b) utilizar las IV. Aunque admito que tal vez no soy lo suficientemente experto econometrista como para dar una respuesta adecuada aquí. Por lo tanto, esperaba que la comunidad pudiera opinar sobre la cuestión. ¿Le parece viable este método como control de la causalidad inversa, o lo ha visto (o algo similar) aplicado en algún lugar antes?

1voto

Richard W Puntos 1799

El planteamiento parece correcto aunque la expresión para $x_{t-1}$ y $y_t$ puede no serlo. Se trata de un modelo de variable instrumental en el que la causalidad entre X e Y debe inferirse en presencia de un factor de confusión que afecta a ambos. Consideremos un DAG confounding variable donde queremos entender el efecto de A sobre X. Debido a que hay una variable desconocida/no observada U que afecta tanto a A como a Y, no podemos tener la independencia entre Y(a) y A. Y(a) es la variable aleatoria cuando A se fija en algún valor a. Ahora, imaginemos que hay otra variable Z que puede predecir completamente a A y por lo tanto hace que la flecha que conecta U->A completamente inútil, es decir Z is an instrument variable . Debido a este fuerte predictor de A, podemos tener $Y(a) \perp A$ . Sin embargo, en la mayoría de los casos, va a tener un término medio entre los dos que implica $Y(a,z) \perp {A}$ . Nos permite crear modelos lineales para entender la relación causal entre A e Y.

  1. $A = v_0 + v_1 * Z + e_1$
  2. $Y = u_0 + u_1 * A + e_2$ y,
  3. $Y = w_0 + w_1*Z + e_3 $

Obteniendo el efecto causal medio de A sobre Y, es decir $E[Y(1)] - E[Y(0)]$ es ahora sencillo. El uso del método de análisis de trayectoria de Sewell nos da $E[Y(1)] - E[Y(0)] = \frac{E[Y(z=1)] - E[Y(z=0)]}{E[A(z=0)] - E[A(z=1)]} = \frac{w_1}{v_1}$

$Y_{t-1}$ está haciendo el mismo trabajo que Z en su caso

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X