Un número real $x_i$ se asigna a cada miembro $i$ de la población $\{1,\ldots,N\}.$ Cuando el índice $I$ es aleatoria y se distribuye uniformemente en esta población, la varianza de la variable aleatoria $x_I$ es $$ \frac 1 N \sum_{i=1}^N (x_i - \mu)^2 \text{ where } \mu = \frac 1 N \sum_{i=1}^N x_i. \tag 0 $$
Un subconjunto aleatorio $\mathscr I$ de tamaño $n \le N$ de la población se distribuye uniformemente entre todos los subconjuntos de tamaño $n.$
Se puede demostrar que $$ \operatorname{E}\left( \frac{N-1}{N(n-1)} \sum_{i\,\in\,\mathcal I} (x_i - \bar x_{\mathscr I})^2 \right) = \sigma^2, \text{ where } \bar x_{\mathscr I} = \frac 1 n \sum_{i\,\in\,\mathscr I} x_i, \tag 1 $$ es decir, la expresión entre paréntesis es un estimador insesgado de $\sigma^2.$
("Estimador insesgado de $\sigma^2$ " hace pas significa simplemente una variable aleatoria cuyo valor esperado es $\sigma^2.$ Por ejemplo, $$ \frac 1 n \sum_{i\,\in\,\mathscr I} (x_i - \mu)^2 \qquad \text{(with $ \N - La UCI $ as in (1))} $$ es pas un estimador insesgado de $\sigma^2$ aunque su valor esperado es $\sigma^2.$ Esto se debe a que no es un estadística es decir, no se puede conocer su valor basándose únicamente en la muestra $\{x_i : i\in\mathscr I\}$ porque no puedes saber $\mu$ sin observar a toda la población).
Línea $(1)$ también puede escribirse como $$ \operatorname{E} \left( \frac{\sum_{i\,\in\,\mathcal I} (x_i - \bar x_{\mathscr I})^2}{\sum_{i\,=\,1}^N (x_i - \mu)^2} \right) = \frac N {N-1} \cdot \frac {n-1} n. \tag 2 $$ Línea $(2)$ no tiene tanta simetría como quisiera: sólo el numerador es aleatorio, y las expectativas son lineales, por lo que no podemos tomar un recíproco en el lado derecho y dentro del paréntesis en el lado izquierdo).
Dos respuestas (hasta ahora) a esta pregunta derivar $(1).$
Mi pregunta es si hay alguna manera hábil y elegante de demostrar $(1),$ en contraste con los métodos pedestres utilizados en las dos respuestas que aparecen hasta ahora.