En la demostración del Teorema 6.5 del libro de Devroye et al. ¿cómo se deriva la última desigualdad? $$ \begin{aligned} \mathbb{E}\left\{|\eta(X)-1/2|\mathbf{I}_{\{g(X)\ne g^*(X)\}}\right\} &\leq \mathbb{E}\left\{\mathbf{I}_{\{\eta(X)\ne1/2\}}|\eta(X)-\tilde\eta(X)|\mathbf{I}_{\{g(X)\ne g^*(X)\}}\right\}\\ &= \mathbb{E}\left\{|\eta(X)-\tilde\eta(X)|\mathbf{I}_{\{g(X)\ne g^*(X)\}}\mathbf{I}_{\{|\eta(X)-1/2|\leq\epsilon\}}\mathbf{I}_{\{\eta(X)\ne1/2\}}\right\}\\ &+ \mathbb{E}\left\{|\eta(X)-\tilde\eta(X)|\mathbf{I}_{\{g(X)\ne g^*(X)\}}\mathbf{I}_{\{|\eta(X)-1/2|>\epsilon\}}\right\}\\ &\leq \sqrt{\mathbb{E}\left\{(\tilde\eta(X) - \eta(X))^2\right\}}\\ &\times \Bigg(\sqrt{\mathbb{P}\left\{|\eta(X)-1/2|\leq\epsilon,\eta(X)\ne1/2\right\}}\\ &+\sqrt{\mathbb{P}\left\{g(X)\ne g^*(X),|\eta(X)-1/2|>\epsilon\right\}}\Bigg) \end{aligned} $$ Tenga en cuenta que $\eta(x) = \mathbb{E}\{Y|X=x\}$ es la función de regresión, $\tilde\eta(x)$ es una aproximación de $\eta(x)$ , $g^*(x)$ es el clasificador de Bayes $$ g^*(x) = \begin{cases} 0 & \text{if } \eta(x)\leq\dfrac{1}{2} \\ 1 & \text{otherwise} \end{cases}$$ y finalmente, $g(x)$ se define como $g^*(x)$ con $\tilde\eta(x)$ sustituyendo a $\eta(x)$ . $\epsilon>0$ es fijo. $\mathbf{I}_A$ es la función indicadora del conjunto $A$ .
Respuesta
¿Demasiados anuncios?Aparece como el método de prueba estándar que $(\mathbb{E}X)^2 \leq \mathbb{E}X^2$ Así que $\mathbb{E}X \leq \sqrt{\mathbb{E}X^2}$ . Así es como llegan todas esas raíces cuadradas en las últimas tres líneas. C-S está escondido ahí, hay que reconocerlo, y tienes que reordenar el $\mathbb{E}\dots \textbf{I}_{stuff}$ en las probabilidades, pero ese es el núcleo.