Así que sé que si los instrumentos $(Z_i)$ en la regresión 2SLS son débiles, es decir $X_i$ y $Z_i$ no están correlacionadas, entonces la condición de rango completo para la matriz $\Sigma_{ZX}=E[Z_iX_i]$ no se cumplirá, pero ¿cómo se puede demostrar esto formalmente?
Respuesta
¿Demasiados anuncios?Si efectivamente no están correlacionados, entonces no hablamos de asintótica de instrumentos débiles. Entonces, la condición de rango para la identificación que $\Sigma_{ZX}$ tienen un rango de columna completo fallarán.
Hay mucha literatura sobre instrumentos débiles, pero una forma de formalizar los instrumentos débiles es postular la siguiente relación entre los regresores y los instrumentos: $$ x_i=\frac{1}{\sqrt{n}}z_i+v_i $$ Esto formaliza la noción de que deseamos tener una asintótica en la que una correlación (posiblemente pequeña) entre el regresor endógeno y el IV se acumule sin límite, de modo que finalmente obtengamos consistencia. En cambio, formalizamos la relación entre los dos para que el conocimiento de la relación entre el regresor y el IV siga estando acotado incluso cuando $n\to\infty$ ya que el coeficiente que relaciona a ambos se reduce a cero cuando $n\to\infty$ .
Por supuesto, es un poco inusual pensar en un parámetro como dependiente del tamaño de la muestra, pero, de nuevo, todas las asintóticas son ficción y, en última instancia, la prueba de si son útiles es la medida en que son capaces de reflejar situaciones reales de muestra finita. Y en la bibliografía se ha comprobado ampliamente que estas asintóticas débiles-IV son útiles.
De hecho, se puede demostrar que la IV no es consistente bajo dicha asintótica:
Considere $$ y_i=x_i\delta+\epsilon_i\;\;(i=1,\ldots,n), $$ donde $y_i, x_i, \epsilon_i$ son escalares. Además, tenemos un instrumento escalar $z_i$ relacionado con $x_i$ a través de $$x_i=z_i\beta+v_i$$ Dejemos que $g_i:=(z_i\epsilon_i,\; z_iv_i)'$ . Haga las siguientes suposiciones, que son estándar excepto la condición 4:
-
$(z_i,\epsilon_i,v_i)$ es una secuencia i.i.d.
-
Igualmente, $g_i$ es i.i.d. con media cero y $E(g_ig_i')=S$ positivo definido.
-
$E(z_i^2)=\sigma_z^2>0$ (se trata de una variante, como sugiere la notación, si $E(z_i)=0$ pero esto último no es necesario).
-
$\beta= 1/\sqrt{n}$ .
Dejemos que $\hat{\delta}:=s_{zx}^{-1}s_{zy}$ , donde $$ s_{zx}=\frac{1}{n}\sum_iz_ix_i, \;\;s_{zy}=\frac{1}{n}\sum_iz_iy_i. $$ Primero demostramos que $\sqrt{n}s_{zx}\xrightarrow{d}\sigma_z^2+a$ , donde $a\sim N(0,S_{22})$ ( $S_{ij}$ es el $(i,j)$ -elemento de $S$ ).
\begin{eqnarray*} \sqrt{n}s_{zx}&=&\sqrt{n}\frac{1}{n}\sum_iz_ix_i\\ &=&\sqrt{n}\frac{1}{n}\sum_iz_i\left(\frac{z_i}{\sqrt{n}}+v_i\right)\\ &=&\underbrace{\frac{1}{n}\sum_iz_i^2}_{\xrightarrow{p}\sigma^2_z \text{ by LLN}}+\underbrace{\frac{1}{\sqrt{n}}\sum_iz_iv_i}_{\xrightarrow{d} a\text{ by CLT}}\\ \end{eqnarray*} (Una suma de expresiones que convergen en probabilidad y distribución convergen en distribución conjuntamente).
A continuación, demostramos que $\hat{\delta}-\delta\xrightarrow{d} (\sigma_z^2+a)^{-1}b$ , donde $b\sim N(0,S_{11})$ y $(a,b)\sim N(0,S)$ son conjuntamente normales.
Utilizando la representación estándar del error de muestreo podemos escribir \begin{eqnarray*} \hat{\delta}-\delta&=&\frac{\frac{1}{n}\sum_iz_i\epsilon_i}{\frac{1}{n}\sum_iz_ix_i}\\ &=&\frac{\frac{1}{\sqrt{n}}\sum_iz_i\epsilon_i}{\frac{1}{\sqrt{n}}\sum_iz_ix_i}\\ &\xrightarrow{d}&\frac{b}{\sigma_z^2+a}, \end{eqnarray*} donde se nos permite observar la distribución de la proporción debido a la normalidad conjunta.
Como $\hat{\delta}-\delta$ converge en distribución a algún v.r., y por tanto no en probabilidad al número cero. Por lo tanto, el estimador es inconsistente.