Antecedentes : Normalmente, para garantizar $\sqrt{n}$ -consistencia, suponemos
1) $\tilde{\theta} \xrightarrow{p}\ \theta_0$
2) $S(\theta,\eta)$ es diferenciable en $\theta$ en $(\theta_0,\eta_0)$ con la matriz de derivación $\Gamma$ de rango completo
3) $|S(\tilde{\theta},\eta_0) - S(\theta_0,\eta_0)| = Op(n^{-1/2}) + op(|\tilde{\theta}-\theta|)$
A partir de 1) y 2), tenemos a $C(\eta_0) > 0$ tal que, con probabilidad que tiende a uno,
$$|S(\tilde{\theta},\eta_0) - S(\theta_0,\eta_0)| \ge C(\eta_0) | \tilde{\theta} - \theta_0 |$$
Lo que significa, con 3)
$$\begin{align} |\tilde{\theta} - \theta_0| &= Op(|S(\tilde{\theta},\eta_0) - S(\theta_0,\eta_0)|) \\ &= Op(n^{-1/2})+ op(|\tilde{\theta}-\theta_0|) = Op(n^{-1/2}) \end{align}$$
lo que demuestra el resultado.
Aquí 3) puede obtenerse a partir de una serie de supuestos. Por lo general, suponemos que
4) $S_n(\tilde{\theta},\eta_0) = Op(n^{-1/2})$
5) $S_n(\theta_0, \eta_0 ) = Op(n^{-1/2})$
6) $S(\theta_0, \eta_0) = 0$
así como un supuesto adicional más técnico. Un ejemplo es
7a) Para cualquier secuencia $\delta_n$ con $\delta_n \to 0$ , $$\sup_{|\theta - \theta_0| < \delta_n} \frac{| S_n(\theta,\eta_0) - S(\theta, \eta_0) - S_n(\theta_0,\eta_0)|}{n^{-1/2} + |\theta - \theta_0| + |S_n(\theta, \eta_0)| + |S(\theta, \eta_0)|} = op(1)$$
Entonces bajo 1, 4-6 y 7a tenemos 3) verdadero.
Prueba de ello: Sea $\delta_n$ sea una secuencia que va a cero tal que
$$P( |\tilde{\theta} - \theta_0| > \delta_n ) \to 0$$
Entonces, tenemos, con probabilidad que tiende a uno,
$$ \begin{align} |S(\tilde{\theta},\eta_0)| - |S_n(\tilde{\theta},\eta_0)| - |S_n(\theta_0,\eta_0)| &\le |S_n(\tilde{\theta},\eta_0) - S(\tilde{\theta},\eta_0) - S_n(\theta_0,\eta_0)| \\ &= op(n^{-1/2} + |\tilde{\theta} - \theta_0|) \\ &+ op(|S_n(\tilde{\theta},\eta_0)|) + op(|S(\tilde{\theta},\eta_0)|) \end{align}$$
lo que da, a partir de 4) y 5),
$$\begin{align} |S(\tilde{\theta},\eta_0)| &= op(n^{-1/2} + |\tilde{\theta} - \theta_0|) + |S_n(\tilde{\theta},\eta_0)|(1 + op(1)) + op(S(\tilde{\theta},\eta_0)) + |S_n(\theta_0,\eta_0)|\\ &= Op(n^{-1/2}) + op(|\tilde{\theta} - \theta_0|) + op(S(\tilde{\theta},\eta_0)) = Op(n^{-1/2}) + op(|\tilde{\theta} - \theta_0|) \end{align}$$
En lugar de 7a), podemos suponer
7b)
$$ [S_n(\tilde{\theta},\eta_0) - S(\tilde{\theta},\eta_0)] - [ S_n(\theta_0,\eta_0) - S(\theta_0,\eta_0)] = Op(n^{-1/2}) + op(|\tilde{\theta} - \theta_0|) $$
Un cálculo sencillo muestra que 7b junto con 4-6 implica 3.
Cuando $\eta_0$ es desconocida, la resultante $\hat{\theta} = \hat{\theta}(\hat{\eta})$ puede satisfacer 1) (véase la página enlazada) y 2) sigue siendo válida. Sin embargo, 3) puede no cumplirse.
Solución 1:
Una forma es suponer que además de la hipótesis anterior 2), el estimador $\hat{\theta} = \hat{\theta}(\hat{\eta})$ satisface
A) $\hat{\theta} \xrightarrow{p}\ \theta_0$
B) $|\hat{\eta} - \eta_0| = Op(n^{-1/2}) $
C) $|S(\hat{\theta},\hat{\eta}) - S(\theta_0,\eta_0)| = Op(n^{-1/2}) + op(|\hat{\theta} - \theta_0|)$
D) $S(\theta,\eta)$ es continua de Lipschitz en $\eta$ en un barrio de $\theta_0$ y $\eta_0$
En el caso de A-D, se cumple la condición 3) y por tanto $\hat{\theta}$ tiene $\sqrt{n}$ -Consistencia.
Prueba: A partir de la continuidad de Lipschitz tenemos a $K > 0$ tal que con probabilidad que tiende a uno
$$| S(\hat{\theta},\eta_0) - S(\hat{\theta},\hat{\eta})| \le K |\hat{\eta} - \eta_0| = Op(n^{-1/2})$$
lo que implica
$$\begin{align}|S(\hat{\theta},\eta_0) - S(\theta_0,\eta_0)| &\le |S(\hat{\theta},\hat{\eta}) - S(\theta_0,\eta_0)| + |S(\hat{\theta},\hat{\eta}) - S(\hat{\theta},\eta_0)| \\ &= Op(n^{-1/2}) + op(|\hat{\theta} - \theta_0|)\end{align}$$
Solución 2:
Alternativamente, si asumimos A) y C) junto con
2') $S(\theta,\eta)$ es diferenciable en $(\theta,\eta)$ en $(\theta_0,\eta_0)$ con la matriz de derivación $\Gamma$ de rango completo
B') $\hat{\eta} \xrightarrow{p}\ \eta_0$
Entonces obtenemos automáticamente nuestro resultado de la derivación en el fondo.