Antes de graduarme en la universidad, tenía un proyecto que consistía en actuar como ayudante de investigación de un político. El proyecto sirvió también como mi tesis de fin de carrera. La parte del informe en la que trabajaba se centraba en determinar el efecto de la nueva legislación sobre ahorro de combustible para los vehículos pesados, como los de 18 ruedas o los grandes camiones y sus conductores.
Conseguí limpiar los datos y juntarlos, pero cuando hice una regresión (con variables ficticias para el año, la región, etc.) me di cuenta de que estaba viendo el policía y crimen problema en acción: los salarios afectaban al empleo, que a su vez afectaba a los salarios, etc. De hecho, comprobé la regresión ejecutándola una vez con los salarios y el empleo en contraposición y tuve un muy El valor p significativo me escupió, con un valor R del 99%, haciéndome ver que tenía un problema.
Sé que tengo que encontrar alguna variable que sólo afecte a una (salarios o empleo) pero no a la otra. (En el documento de Levitt, utiliza las elecciones, que afectan a la presencia policial y no a la delincuencia). ¿Qué tipo de variable sería ésta en mi modelo de salarios/empleo? ¿Hay otras formas de evitar el problema de la endogeneidad?
Puedo publicar datos si se solicitan, aunque mi pregunta es más conceptual que centrada en los datos.