No pude encontrar los cálculos de ejemplo que corresponden al problema específico aquí (como sugiere Glen_b), pero pude confirmar la siguiente respuesta con cálculos numéricos en R al final de esta respuesta.
Sea $N$ es el número inicial de unidades de la población y $N + 1$ sea el número de unidades de la población después del cambio. Denotemos el conjunto inicial de observaciones $X = \{x_1, \ldots, x_N\}$ (es decir, una observación correspondiente a cada unidad de población). Denotemos el conjunto de observaciones después del cambio $Y = X \cup \{x_{N+1}\}$ .
La media de $X$ es
$\mu_X = \frac{\sum_{i=1}^N{x_i}}{N}$ .
La media de Y es
$\mu_Y = \frac{\sum_{i=1}^{N+1}{x_i}}{N+1} = \mu_X \frac{N}{N+1} + \frac{x_{N+1}}{N+1}$
Defina $x_{N+1}$ como la media original, $\mu_X$ y algunos $\varepsilon$ . Entonces, la media de $Y$ es
$\mu_Y = \mu_X \frac{N}{N+1} + \frac{\mu_X + \varepsilon}{N+1} = \mu_X + \frac{\varepsilon}{N+1}$
La varianza de $Y$ es
$\sigma^2_Y = \frac{\sum_{i=1}^{N+1} \left(x_i - \mu_Y \right)^2}{N+1} = \frac{\sum_{i=1}^{N+1} \left(x_i - \mu_X - \frac{\varepsilon}{N + 1} \right)^2}{N+1}$
$= \frac{\sum_{i=1}^{N} x_i^2 + \mu_X^2 + \frac{\varepsilon^2}{\left(N+1\right)^2} - 2x_i\mu_X - 2x_i\frac{\varepsilon}{N+1} + 2\mu_X\frac{\varepsilon}{N+1}}{N + 1}$
$\frac{\left(\mu_X + \varepsilon - \mu_X - \frac{\varepsilon}{N + 1}\right)}{N + 1} $
$ = \frac{N}{N+1}\sigma^2_X + \frac{N\varepsilon^2}{\left(N+1\right)^3} - \frac{2N\mu_X\varepsilon}{\left(N+1\right)^2} + \frac{2N\mu_X\varepsilon}{\left(N+1\right)^2} + \frac{N^2\varepsilon^2}{\left(N+1\right)^3}$
$ = \frac{N}{N+1} \sigma^2_X + \frac{N}{\left(N+1\right)^2}\varepsilon^2$
En $x_{N+1}$ es igual a $\mu_X$ la varianza de $Y$ es
$\frac{N}{N+1}\sigma^2_X < \sigma^2_X $
Así, cuando $\varepsilon$ es suficientemente pequeño $\sigma^2_Y$ es inferior a $\sigma^2_X$ . Para determinar el tamaño $\varepsilon$ debe ser tal que el varianza de $Y$ es mayor que la varianza de $X$ fijé las dos varianzas iguales.
$ \frac{N}{N+1} \sigma^2_X + \frac{N}{\left(N+1\right)^2}\varepsilon^2 = \sigma^2_X$
$ \frac{N}{\left(N+1\right)^2}\varepsilon^2 = \frac{1}{N+1} \sigma^2_X$
$ \varepsilon^2 = \frac{N+1}{N} \sigma^2_X $
$ \varepsilon = \pm \sigma_X \sqrt{\frac{N+1}{N}}$
Por lo tanto, añadir una unidad cuya observación esté dentro de $\sqrt{\frac{N+1}{N}}$ desviaciones típicas de la media antigua dará lugar a una varianza menor.
El siguiente script R verifica la conclusión anterior:
N <- 10
X <- runif(N)
width <- sqrt((N+1)/N)
# on the boundary
var(c(X, mean(X) + width * sqrt(var(X)))) - var(X) == 0
# outside the boundary
var(c(X, mean(X) + width * sqrt(var(X)) + 1)) - var(X) > 0
# inside the boundary
var(c(X, mean(X))) - var(X) < 0