11 votos

¿Cómo abordan las variables instrumentales el sesgo de selección?

Me pregunto cómo una variable instrumental aborda el sesgo de selección en la regresión.

Este es el ejemplo que estoy masticando: En Econometría inofensiva los autores analizan una regresión IV relacionada con el servicio militar y los ingresos en etapas posteriores de la vida. La pregunta es: "¿El servicio militar aumenta o disminuye los ingresos futuros?". Investigan esta cuestión en el contexto de la guerra de Vietnam. Entiendo que el servicio militar no puede asignarse aleatoriamente, y que esto es un problema para la inferencia causal.

Para abordar esta cuestión, el investigador utiliza la posibilidad de ser llamado a filas (como en "su número de reclutamiento es llamado") como un instrumento para el servicio militar real. Esto tiene sentido: el reclutamiento de Vietnam aleatoriamente asignó a los jóvenes estadounidenses al ejército (en teoría; si los reclutas sirvieron realmente es algo que toca a mi pregunta). Nuestra otra condición IV parece sólida: la elegibilidad para el servicio militar obligatorio y el servicio militar real están fuerte y positivamente correlacionados.

Esta es mi pregunta. Parece que habría un sesgo de autoselección: quizá los chicos más ricos puedan librarse de servir en Vietnam, aunque les llamen a filas. (Si ese no fuera realmente el caso, imaginémoslo por el bien de mi pregunta). Si esta autoselección crea un sesgo sistémico dentro de nuestra muestra, ¿cómo aborda nuestra variable instrumental este sesgo? ¿Debemos reducir nuestro ámbito de inferencia a "los tipos de personas que no pudieron escapar al reclutamiento"? ¿O la variable instrumental salva de algún modo esa parte de nuestra inferencia? Si alguien pudiera explicar cómo funciona esto, le estaría muy agradecido.

14voto

Andy Puntos 10250

En realidad, el problema del sesgo de selección es la motivación inicial para utilizar instrumentos. La cuestión aquí es si el sorteo aleatorio del draft evita este problema. Tiene toda la razón al preguntar: ¿cuáles son las limitaciones de este instrumento? Si los niños ricos tienen más posibilidades de evitar el servicio militar, entonces el efecto negativo del servicio sobre los ingresos posteriores estará sobreestimado en términos absolutos.

Había otras formas de eludir el servicio militar obligatorio, por ejemplo, por motivos de salud. O, por el contrario, entre los posibles reclutas se sabía que presentarse voluntario en lugar de ser reclutado por sorteo daba lugar a mejores destinos y condiciones de servicio. De ahí que las personas con números de lotería que tenían más probabilidades de ser reclutadas optaran a menudo por el voluntariado. Si este comportamiento de evasión socava el proceso de aleatorización del modo que usted describe, entonces nuestras estimaciones 2SLS seguirán estando sesgadas. Limitar la muestra a los que no escaparon al reclutamiento no le ayuda en este caso porque la aleatorización del tratamiento no es realmente aleatoria.
Sin embargo, si el incumplimiento del tratamiento sigue siendo aleatorio o no significativo por término medio, los números de la lotería pueden seguir utilizándose como instrumento. En este caso, su instrumento para el servicio militar es la intención de tratar (ITT, véase el capítulo correspondiente en el libro de Angrist y Pischke). Por lo tanto, lo importante es que si hay incumplimiento debido a cualquier motivo, debemos demostrar que esto no invalida la aleatorización. Entonces este instrumento está bien, de lo contrario no podemos utilizarlo.

Hay un par de formas de comprobarlo. Podrías hacer una regresión del instrumento $Z_i$ en características personales que no se ven afectadas por el tratamiento $D_i$ como la edad, la raza, etc., que se determinan antes de $D_i$ está determinada. Otra comprobación consiste en probar el efecto del instrumento sobre el resultado en muestras sin relación entre $D_i$ y $Z_i$ como los voluntarios que se ofrecieron antes de recibir un número de lotería. La idea es que si la única razón por la que su número de lotería afecta a sus ingresos posteriores es a través de la situación de servicio, entonces la posibilidad de ser llamado a filas no debería tener ningún efecto sobre los ingresos en las muestras en las que no está relacionado con la situación de servicio.

Angrist (1990) realiza algunas de estas comprobaciones para solucionar tu preocupación. A pesar de las preocupaciones planteadas anteriormente, resulta que el proyecto de lotería parece ser un instrumento sólido. Berinsky (2010) ofrece muchos más controles de aleatoriedad y proporciona más información sobre la historia de la lotería.

3 votos

¡Buena respuesta! El estribillo de la canción de Phil Ochs Borrador Dodger Rag enumera posibles mecanismos para evitar el borrador. Siempre he pensado que comprobarlos habría sido un trabajo divertido.

0 votos

Gracias. Eso lo aclara todo; también leeré los artículos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X