He tenido en el pasado una serie de preguntas que me relativos a artículos publicados en un número de áreas donde las regresiones (y los modelos relacionados, tales como modelos de panel o GLMs) se utilizan en la observación de los datos (es decir, los datos no se producen por el experimento controlado, en muchos casos - pero no siempre - los datos que se observan a lo largo del tiempo), pero donde no hay ningún intento de introducir variables instrumentales se hace.
He hecho una serie de críticas en la respuesta (como describir los problemas con el sesgo cuando las variables importantes que pueden faltar), pero dado que otras personas aquí, sin duda, será mucho más conocimiento que yo en este tema, pensé que había que preguntar:
¿Cuáles son las principales cuestiones/consecuencias de tratar de llegar a conclusiones acerca de las relaciones (en particular, pero no limitado a conclusiones causales) en este tipo de situaciones?
Puede algo útil que hacer con los estudios que se ajuste a tales modelos en la ausencia de instrumentos?
¿Cuáles son algunas buenas referencias (libros o artículos) en los problemas con este modelo (de preferencia con claro no técnicos, la motivación de las consecuencias, ya que normalmente la gente que pregunta tiene una gran variedad de fondos, algunos sin mucho estadísticas) que la gente podría referirse al criticar a un papel? Discusión de las precauciones/problemas con los instrumentos que sería útil también.
(Referencias básicas sobre variables instrumentales son de aquí, aunque si tienes cualquier agregar allí, que también sería útil.)
Los punteros a los buenos ejemplos prácticos de búsqueda y uso de instrumentos sería una ventaja, pero no es central a esta pregunta.
[I probable que señalar a otros a cualquier buen respuestas aquí como tales preguntas vienen a mí. Me puede agregar uno o dos ejemplos de como yo las entiendo.]