47 votos

¿Qué es una variable instrumental?

Las variables instrumentales son cada vez más frecuentes en la economía y la estadística aplicadas. Para los no iniciados, ¿podemos tener algunas respuestas no técnicas a las siguientes preguntas?

  1. ¿Qué es una variable instrumental?
  2. ¿Cuándo se quiere emplear una variable instrumental?
  3. ¿Cómo se encuentra o elige una variable instrumental?

4 votos

¿No crees que el artículo de la Wikipedia sobre el tema es suficiente?

1 votos

Preguntas como esta requieren una respuesta tipo wiki / blog. Creo que las preguntas no deberían requerir respuestas tan largas.

0 votos

No estoy seguro de que lo correcto sea simplemente ignorar esta pregunta y remitir al preguntante a la wiki, especialmente durante la fase beta, en la que estamos tratando de construir el contenido del sitio. Tal vez el autor de la pregunta debería presentar cada una de estas preguntas individualmente para que puedan ser mejor atendidas.

53voto

Andy Puntos 10250

Lo que sigue puede parecer un poco técnico debido al uso de ecuaciones, pero se basa principalmente en los gráficos de flechas para proporcionar la intuición que sólo requiere una comprensión muy básica de OLS - así que no se repulse].

Supongamos que se quiere estimar el efecto causal de $x_i$ en $y_i$ dado por el coeficiente estimado para $\beta$ pero por alguna razón hay una correlación entre su variable explicativa y el término de error:

$$\begin{matrix}y_i &=& \alpha &+& \beta x_i &+& \epsilon_i & \\ & && & & \hspace{-1cm}\nwarrow & \hspace{-0.8cm} \nearrow \\ & & & & & corr & \end{matrix}$$

Esto puede deberse a que hemos olvidado incluir una variable importante que también se correlaciona con $x_i$ . Este problema se conoce como sesgo de variable omitida y entonces su $\widehat{\beta}$ no le dará el efecto causal (véase aquí para los detalles). Este es un caso en el que se querría utilizar un instrumento porque sólo así se puede encontrar el verdadero efecto causal.

Un instrumento es una nueva variable $z_i$ que no está relacionado con $\epsilon_i$ pero que se correlaciona bien con $x_i$ y que sólo influye en $y_i$ a través de $x_i$ - así que nuestro instrumento es lo que se llama "exógeno". Es como en este gráfico de aquí:

$$\begin{matrix} z_i & \rightarrow & x_i & \rightarrow & y_i \newline & & \uparrow & \nearrow & \newline & & \epsilon_i & \end{matrix}$$

¿Cómo se utiliza esta nueva variable?
Tal vez recuerde la idea del tipo ANOVA detrás de la regresión, donde se divide la variación total de una variable dependiente en un componente explicado y otro no explicado. Por ejemplo, si haces una regresión de tu $x_i$ en el instrumento,

$$\underbrace{x_i}_{\text{total variation}} = \underbrace{a \quad + \quad \pi z_i}_{\text{explained variation}} \quad + \underbrace{\eta_i}_{\text{unexplained variation}}$$

entonces sabes que la variación explicada aquí es exógena a nuestra ecuación original porque depende de la variable exógena $z_i$ sólo. Así que en este sentido, dividimos nuestro $x_i$ en una parte que podemos afirmar que es ciertamente exógena (es la parte que depende de $z_i$ ) y alguna parte inexplicable $\eta_i$ que mantiene toda la variación mala que se correlaciona con $\epsilon_i$ . Ahora tomamos la parte exógena de esta regresión, la llamamos $\widehat{x_i}$ ,

$$x_i \quad = \underbrace{a \quad + \quad \pi z_i}_{\text{good variation} \: = \: \widehat{x}_i } \quad + \underbrace{\eta_i}_{\text{bad variation}}$$

y poner esto en nuestra regresión original: $$y_i = \alpha + \beta \widehat{x}_i + \epsilon_i$$

Ahora bien, como $\widehat{x}_i$ ya no está correlacionada con $\epsilon_i$ (recuerda que hemos "filtrado" esta parte de $x_i$ y lo dejó en $\eta_i$ ), podemos estimar sistemáticamente nuestro $\beta$ porque el instrumento nos ha ayudado a romper la correlación entre la variable explicativa y el error. Esta es una de las formas de aplicar las variables instrumentales. Este método se llama en realidad mínimos cuadrados en dos etapas, donde nuestra regresión de $x_i$ en $z_i$ se llama "primera etapa" y la última ecuación se llama "segunda etapa".

En términos de nuestra imagen original (dejo fuera el $\epsilon_i$ para no ensuciar pero ¡recordar que está ahí!), en lugar de tomar la ruta directa pero defectuosa entre $x_i$ a $y_i$ dimos un paso intermedio a través de $\widehat{x}_i$

$$\begin{matrix} & & & & & \widehat{x}_i \newline & & & & \nearrow & \downarrow \newline & z_i & \rightarrow & x_i & \rightarrow & y_i \end{matrix}$$

Gracias a este ligero desvío de nuestro camino hacia el efecto causal pudimos estimar consistentemente $\beta$ utilizando el instrumento. El coste de esta desviación es que los modelos de variables instrumentales suelen ser menos precisos, lo que significa que tienden a tener errores estándar más grandes.

¿Cómo encontramos los instrumentos?
No es una pregunta fácil porque hay que argumentar bien por qué su $z_i$ no estaría correlacionada con $\epsilon_i$ - esto no puede probarse formalmente porque el verdadero error no se observa. Por lo tanto, el principal reto consiste en idear algo que pueda considerarse exógeno de forma plausible, como las catástrofes naturales, los cambios políticos o, a veces, incluso se puede realizar un experimento aleatorio. Las otras respuestas tenían algunos ejemplos muy buenos para esto, así que no repetiré esta parte.

12 votos

+1 Agradezco haber leído por fin una respuesta detallada en lugar de una lista de referencias o enlaces.

1 votos

Excelente. Se lo explico a mis alumnos más "mnemotécnicamente" como: $x$ está envenenado/manchado por factores no observados en $\epsilon$ . La regresión de la primera etapa "limpia"/sacude el veneno de $x$ . Podemos utilizar la versión "limpia" de $x$ para encontrar el coeficiente causal, $\beta$ .

0 votos

¿Existe un argumento intuitivo por el que la estimación 2SLS para $\beta$ ¿es coherente? Cuando calculamos $\widehat{x}_i$ Estamos "filtrando" la parte de $x_i$ que se correlaciona con el error, pero por qué el filtrado no cambia $x_i$ de manera que cambie nuestra estimación de $\beta$ ?

19voto

Berek Bryan Puntos 349

Como estadístico médico sin conocimientos previos de econom(etr)ica, me costó hacerme con las variables instrumentales, ya que a menudo me costaba seguir sus ejemplos y no entendía su terminología bastante diferente (por ejemplo, "endogeneidad", "forma reducida", "ecuación estructural", "variables omitidas"). He aquí algunas referencias que me resultaron útiles (la primera debería ser de libre acceso, pero me temo que las demás probablemente requieran una suscripción):

También recomendaría el capítulo 4 de:

13voto

simmosn Puntos 304

Estas son algunas diapositivas que preparé para un curso de econometría en la UC Berkeley. Espero que le resulten útiles; creo que responden a sus preguntas y proporcionan algunos ejemplos.

También hay tratamientos más avanzados en las páginas de los cursos PS 236 y PS 239 (cursos de métodos de ciencias políticas a nivel de posgrado) en mi sitio web: http://gibbons.bio/teaching.html .

Charlie

0 votos

El enlace a las diapositivas de Berkeley ya no es válido.

9voto

pauly Puntos 932

No técnico (normalmente es lo único que se me da bien de todos modos): Hay veces que no sólo X causa Y, sino que Y también causa X. Una variable instrumental es un dispositivo que puede "limpiar" esta relación desordenada e inconveniente para que se puedan hacer las mejores estimaciones del efecto de X sobre Y.

La variable instrumental se elige en virtud de sus relaciones: es una causa de X, pero, aparte de actuar a través de X, no tiene ningún efecto sobre Y. El instrumento (o los instrumentos) se utiliza en la primera etapa para calcular una nueva "versión" de X, que no es en absoluto una función de Y. Esta nueva X "predicha" se utiliza entonces en una segunda etapa, en una regresión más estándar, para explicar/predecir Y. De ahí el término regresión por mínimos cuadrados en dos etapas.

Normalmente se encuentra el IV en los procesos que anulan o escapan al control de X O Y, como las variables que dependen de leyes, políticas, actos de la naturaleza, etc.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X