Consideremos una serie de variables aleatorias uniformes independientes $U_1,U_2,U_3,... \sim \text{IID U}(0,1)$ y formar la serie correspondiente $X_1,X_2,X_3,...$ como:
$$X_i = \cos(\pi U_i).$$
Para todos $|x| \leqslant 1$ estas últimas variables aleatorias tienen la función de distribución
$$\begin{equation} \begin{aligned} F_X(x) = \mathbb{P}(X \leqslant x) &= \mathbb{P}(\cos(\pi U) \leqslant x) \\[6pt] &= \mathbb{P} \Big( U \geqslant \frac{1}{\pi} \cdot \arccos(x) \Big) \\[6pt] &= 1 - \frac{1}{\pi} \cdot \arccos(x), \\[6pt] \end{aligned} \end{equation}$$
y la función de densidad correspondiente:
$$\begin{equation} \begin{aligned} f_X(x) = \frac{dF_X}{dx}(x) &= -\frac{1}{\pi} \cdot \frac{d}{dx} \arccos(x) \\[6pt] &= \frac{1}{\pi} \cdot \frac{1}{\sqrt{1-x^2}}. \\[6pt] \end{aligned} \end{equation}$$
Esta variable aleatoria tiene media $\mathbb{E}(X) = 0$ y varianza $\mathbb{V}(X) = \tfrac{1}{2}$ . Ahora, dejemos que $S_n = \sum_{i=1}^n X_i$ sea una suma parcial de estas variables, y observe que tiene media $\mathbb{E}(S_n) = 0$ y varianza $\mathbb{V}(S_n) = \tfrac{n}{2}$ . Según el teorema del límite central, la distribución límite de la suma normalizada es la distribución normal estándar. Para grandes $n$ tenemos la distribución aproximada:
$$S_n \overset{\text{Approx}}{\sim} \text{N} \Big( 0, \frac{n}{2} \Big).$$
La varianza de la suma aumenta con $n$ por lo que no hay convergencia a cero --- la suma se distribuirá alrededor de cero, pero su varianza se hace más y más grande. Sin embargo, si se observa la media muestral $\bar{X}_n = S_n/n$ , la varianza de esta última cantidad disminuye a cero, por lo que se tendrá convergencia a la media de cero. Este último resultado es una manifestación de la ley de los grandes números .
Simulación: Podemos simular este problema en R
como sigue. En este código trazamos la densidad del núcleo de $m = 10^5$ simulaciones para $n=100$ y superponemos la densidad normal como línea discontinua roja. Se puede ver que se trata de una aproximación muy cercana a la densidad del núcleo de las simulaciones.
#Simulate matrix of cosine values
set.seed(1);
m <- 10^5;
n <- 100;
U <- matrix(runif(n*m,0,1), nrow = m);
X <- cos(pi*U);
#Calculate sample total of cosine values
S <- rowSums(X);
#Create data-frame for plotting
DD <- density(S);
NN <- dnorm(DD$x, mean = 0, sd = sqrt(n/2));
GRAPH <- data.frame(S = DD$x, Density = DD$y, Approx = NN);
#Plot density of sample totals
library(ggplot2);
FIGURE <- ggplot(data = GRAPH, aes(x = S, y = Density)) +
geom_line(size = 1) +
geom_line(aes(y = Approx), colour = 'red', linetype = 'dashed') +
ggtitle('Density of Sample Means of Cosine Simulations') +
xlab('Sample Mean') + ylab('Density');
FIGURE;