Supongamos que tengo una variable aleatoria $X$ con valores en $\mathbb{R}^n$ y una función $\mathscr{L}:\mathbb{R}^n \to \mathbb{R}$ . En la práctica $X$ podría representar una distribución de datos, y $\mathscr{L}$ puede ser una función de pérdida asociada a un algoritmo de entrenamiento, por ejemplo. Me interesa analizar la diferencia entre la distribución de $\mathscr{L}(X)$ y la distribución que resulta de tomar $n$ independiente se nutre de $X$ y promediando el valor de $\mathscr{L}$ sobre ellos. $$\mathscr{L}(X) \quad \text{vs} \quad \frac{1}{n} \sum_i \mathscr{L}(X_i) , \,\, \quad X_i \text{ are i.i.d. copies of }X$$ En particular, me interesaría ver la expectativa de estas dos cosas diferentes.
(Por ejemplo, si $\mathscr{L}$ es la función de identidad, y miramos las expectativas, estamos mirando la media empírica frente a la media verdadera).
Obviamente no se puede decir nada a este nivel de generalidad. Pero me interesa leer sobre las técnicas que son relevantes para tal problema.
(Cruzado en la pila de estadísticas aquí )