El libro que he leído (Davidson,MacKinnon - Econométricos Teoría y Métodos) se describe la definición de "óptimo instrumento de variables" como la siguiente:
Generalmente, y esto se ve muy a menudo en otros libros de texto que lidiar con los modelos de regresión, queremos estimar ${\mathbb E}\left(y | X\right)$. Otra manera de decir la misma cosa, pero en un sentido más general es que queremos estimar ${\mathbb E}\left(y | \Omega\right)$. $\Omega$ es un conjunto de información que contiene todas las variables que determinan el resultado de $y$.
En el contexto del instrumento variable de estimación consideramos que el modelo usual $y = X\beta + u$ con homoscedástica $u$'s. Ahora se supone que al menos una variable explicativa de X es endógeno. Por lo tanto queremos encontrar una matriz $W$ de los instrumentos que minimicen la asmyptotic matriz de covarianza de $\beta_{IV}$.
Aquí me pierdo. Se supone que, en general, $X$ puede suponer para satisfacer la relación $X = \bar X + V$ donde$E(V|\Omega) = 0$$\bar X = E(X|\Omega)$. Ahora $\bar X$ que se supone será el óptimo de la matriz de instrumentos pero yo no lo $\bar X$ se supone debe ser. Sí, es el resultado que se espera de $X$ da toda la información que se encuentra en $\Omega$, pero si una variable en $X$ se supone que para ser endógeno y puedo reemplazar esta variable con una combinación lineal de las restantes variables que se supone exógena y que $\bar X$, me pregunto por qué $\bar X$ es un instrumento viable. ¿Por qué es esto $\bar X$ no se correlaciona con $u$ no más?
Yo no estoy buscando una solución técnica, ni de una prueba matemática de algún tipo. Me gustaría entender la idea detrás de este enfoque.