Intentaré dar una respuesta amplia a este problema. En lugar de trabajar con funciones de distribución, trabajaré con las correspondientes variables aleatorias $X_1, X_2, \ldots, X_\infty$ para facilitar la notación.
¿Es correcta la afirmación si permitimos $\phi$ sea una función continua cualquiera?
Por desgracia, la respuesta es no. El primer problema es que, en general $E[f(x_i)]$ no necesita existir para cada función continua $f$ . Por ejemplo, el Distribución de Cauchy . Esta distribución no tiene una expectativa finita, por lo que podemos construir un contraejemplo suponiendo $X$ para que esté distribuida en Cauchy y estableciendo $X_n = \frac{X}{n}$ . Entonces, claramente $X_n$ converge casi con seguridad a $X_\infty = 0$ y, por tanto, también débilmente. Pero para $f(x) = x$ el valor de $E[f(X_n)]$ es indefinido, excepto para $E[f(X_\infty)] = E[0] = 0$ .
¿Y si restringimos $\phi$ a la clase de funciones para que todas $E[f(X_n)]$ ¿Existe?
Por desgracia, esto sigue sin funcionar. Supongamos que $P(X_n = \frac{1}{n}) = 1 - \frac{1}{n}$ y $P(X_n = n + \frac{1}{n} - 1) = \frac{1}{n}$ . Es fácil ver que $X_n$ converge en probabilidad a $X_\infty = 0$ y, por tanto, débilmente. Elección de $f$ para ser la identidad, podemos ver que $E[f(x_n)] = 1$ no converge a $E[f(x_\infty)] = 0$ .
El problema en este caso es que una función continua general puede "explotar" una parte despreciable de la distribución.
¿Y si restringimos $\phi$ sea una función continua y acotada?
En este caso, la equivalencia es correcta.
Para ver que la convergencia de las funciones implica una convergencia débil, dejemos que $x$ sea un punto de continuidad de la distribución de $X_\infty$ . Ahora podemos aproximar el Indicador $f(t) = I\{t \le x\}$ desde abajo y desde arriba mediante funciones continuas. En concreto, elegimos $\underline{f_m}$ para ser uno en $(-\infty, x - \frac{1}{m}]$ , cero en $[x, \infty)$ y lineal en el medio. Del mismo modo, elegimos $\overline{f_m}$ para ser uno en $(-\infty, x]$ uno en $[x+ \frac{1}{m}, \infty)$ y lineal en el medio. Recomiendo hacer un rápido esquema de estas funciones.
Ahora podemos ver fácilmente que $\underline{f_m} \le f \le \overline{f_m}$ y por lo tanto $$\lim \limits_{n \to \infty} E[\underline{f_m}(X_n)] \le \lim \limits_{n \to \infty}E[f(X_n)] \le \lim \limits_{n \to \infty} E[\overline{f_m}(X_n)]$$ lo que implica, por suposición, que $$E[\underline{f_m}(X_\infty)] \le \lim \limits_{n \to \infty}P(X_n \le x) \le E[\overline{f_m}(X_\infty)].$$
Ahora observe que $P(X_\infty \le x - \frac{1}{m}) \le E[\underline{f_m}(X_\infty)]$ y una desigualdad similar para el límite superior da como resultado $$P\left(X_\infty \le x - \frac{1}{m}\right) \le \lim \limits_{n \to \infty}P(X_n \le x) \le P\left(X_\infty \le x + \frac{1}{m}\right).$$ La afirmación se desprende ahora de la observación de que $x$ es un punto de continuidad de $F_\infty$ y dejar que $m \to \infty$ .
La otra dirección de la equivalencia es un trabajo un poco más tedioso. Esta prueba funciona por aproximaciones simples, sólo voy a esbozar cómo funciona.
En primer lugar, observamos que las medidas débilmente convergentes son apretado por lo que el primer paso de la aproximación es restringir nuestra función continua a algún intervalo compacto $K$ . Desde $F_\infty$ es monótona, tiene a lo sumo un número contable de puntos de discontinuidad. Por lo tanto, podemos elegir una secuencia de particiones $S_m$ de $K$ que consisten sólo en puntos de continuidad de $F_\infty$ y cuya malla converge a cero. Si $S_m = \{x_1, \ldots, x_m\}$ elegimos aproximar nuestra función continua y acotada $f$ por $f_m(t) = \sum \limits_{i = 1}^{m - 1} f(x_i) I\{x_i < t \le x_{i + 1}\}$ . Observe que $E[I\{x_i < X_\infty \le x_{i + 1}\}] = P_\infty(x_{i + 1}) - P_\infty(x_i)$ .
El resto de la prueba consiste en mostrar que nuestra aproximación es lo suficientemente buena como para garantizar $E[f(X_n)] \to E[f(X_\infty)]$ realmente se mantiene.
¿Podemos ampliar o restringir aún más nuestra clase de funciones, de modo que la equivalencia siga siendo válida?
La respuesta es sí. Se puede encontrar una lista de posibles caracterizaciones de la convergencia débil aquí .
¿Podemos restringir nuestras funciones a funciones continuas que se soportan de forma compacta?
La respuesta es no, por ejemplo $X_n \sim \mathcal{U}[n, n + 1]$ . Entonces $X_n$ no converge débilmente [ya que no es ajustada], pero para toda función compactamente soportada $f$ tenemos $E[f(X_n)] \to 0$ .
Sin embargo, la noción de convergencia que se induce al considerar únicamente funciones con soporte compacto se denomina convergencia vaga . Se puede demostrar [Thm 5.20 en Kallenberg ] que una secuencia de variables aleatorias converge débilmente si converge vagamente y es ajustada.