7 votos

¿Por qué el gradiente de conmutar con la toma de expectativa?

Deje $X, Y$ ser de dos variables aleatorias, con $X$ tomando valores en $\Bbb R^n$ $Y$ tomando valores en $\Bbb R$.

A continuación, podemos ver la función $h: \Bbb R^n \to \Bbb R$ dada por $$\beta \mapsto \Bbb E[(Y-X^T\beta)^2]$$ It is claimed that the gradient of $h$ is given by $$\nabla h = \Bbb E[2X(X^T\beta-Y)]$$

Esto parece como un caso especial de la identidad

$$\nabla \Bbb E[f]=\Bbb E [\nabla f]$$

Donde la expectativa es tomado a través de la mutua de distribución de algunas variables aleatorias.

Formalmente, queremos que la siguiente: Supongamos $X_1,...,X_m$ son variables aleatorias devolver valores en algunos de los conjuntos de $A_i$ con algún mutuo de distribución de probabilidad. A continuación, para cada función de $f: \Bbb R^n \times \prod A_i \to \Bbb R$, para cada $\beta \in \Bbb R^n$ podemos formar la variable aleatoria $f(\beta, X_1,...,X_m)$ y llevar a sus expectativas. Tomando diferentes valores de $\beta$ da lugar a una función de $\Bbb R^n \to \Bbb R$. Pretendemos que su pendiente es igual al vector obtenido por primera fijación de los valores de $X_1,...,X_m$ y tomando el gradiente resultante de la función de $\Bbb R^n \to \Bbb R$, y esto le da una variable aleatoria devolver valores en $\Bbb R^n$, para lo cual puede tomar la expectativa.

4voto

keruilin Puntos 1024

Que no es el más general de la versión. Es sólo conveniente para la prueba. Básicamente dice, se puede diferenciar en expectativa.

Considere la posibilidad de $f:\Omega \times U \to \mathbb R$ donde $(\Omega, \mathcal A, P)$ es cierta probabilidad de espacio (O $\sigma$ finito medir el espacio si te gusta) y $U\subseteq \mathbb R^n$ es abierto y contiene $0$.

  1. Asumir para (casi) todos los $\omega\in\Omega$ la función de $z \mapsto f(\omega, z)$ es diferenciable y definir $g(\omega, z) = D_{z} f(\omega, z)$.

  2. Asumir que hay un $P$integrable función de $S:\Omega \to \mathbb R$ $\|g(\;.\;, z)\| \le S$ (casi) todo el mundo por todas partes $z\in U$ y definen $G(z) = \int g(\;.\;, z) dP$.

  3. Suponga $G$ es continua en a $0$.

A continuación, $F$ es diferenciable en a $0$ con $$ D F(0) = G(0). $$

Prueba:

Para (casi) todos los $\omega\in\Omega$ tenemos $\|g(\omega,\;.\;)\| \le S(\omega) < \infty$. Que es $f(\omega, \;.\;)$ es lipschitz continua y el teorema fundamental del cálculo se aplica. Así, por $z\in U$ hemos \begin{align*} F(z) - F(0) - G(0)z &= \int f(\omega, z) - f(\omega,0) - g(\omega,0)z \; dP(\omega) \\ &= \int \int_{0}^1 g(\omega, tz)z - g(\omega, 0)z \; dt\, dP(\omega) \\ &=\biggl(\underbrace{\int \int_{0}^1 g(\omega, tz) - g(\omega, 0) \; dt \, dP(\omega)}_{R(z)} \biggr) z. \end{align*} Desde $$ \int\int_0^1 \| g(\omega, tz) - g(\omega, 0) \| \; dt \, dP(\omega) \le \int\int_0^1 2 S(\omega) \; dt \, dP(\omega) = 2 \int S \, dP < \infty$$ El teorema de Fubini se aplica y para $z\to 0$ hemos $$ R(z) = \int_0^1 \int g(\omega, tz) - g(\omega, 0)\; dP(\omega) \, dt = \int_0^1 G(z) - G(0) \, dt \a 0. $$ Es decir, $F$ es diferenciable en a $0$ con $$ DF(0) = G(0). $$

Notas:

  1. Los supuestos son obviamente satisfecho en su caso.

  2. Nos podemos relajar la hipótesis 1 y 2: se supone que para casi todos los $\omega\in\Omega$ la función de $f(\omega,\;.\;)$ a nivel local es absolutamente continua con $$ \sup_{z\in U} \int \| D_z f(\;.\;, z) \| \, dP < \infty. $$ Sin embargo, la necesidad de ser cuidadosos con el dominio de $D_z f$.

  3. Podemos reemplazar la Fubini tipo de argumento con una Convergencia Dominada tipo de argumento con un poco más fuerte que el de la asunción 3. Esto permitiría que cada medida, en lugar de sólo $\sigma$ finito.

2voto

Calculon Puntos 1422

$\beta$ no es una variable aleatoria, de modo que usted puede expandir la expresión y tome $\beta$ como un factor. Luego se diferencian en que la expresión con el respeto a $\beta$ y comprobar que la afirmación de la igualdad se mantiene. No es más complicado que eso. Sería un problema si no se podía factor de $\beta$ (por ejemplo,$e^{X^{\top}\beta}$). Entonces de verdad se tiene que justificar el intercambio de integración y diferenciación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X