El uso de las definiciones de la media
$$\mu_{1:n} = \frac{1}{n}\sum_{i=1}^n x_i$$
y la varianza de la muestra
$$\sigma_{1:n}^2 = \frac{1}{n}\sum_{i=1}^n \left(x_i - \mu_{1:n}\right)^2 = \frac{n-1}{n}\left(\frac{1}{n-1}\sum_{i=1}^n \left(x_i - \mu_{1:n}\right)^2\right)$$
(el último término entre paréntesis es el insesgada de la varianza del estimador de frecuencia calculada por defecto en el software de estadística) para encontrar la suma de los cuadrados de todos los datos de $x_i$. Vamos a la orden de los índices de $i$, de modo que $i=1,\ldots,n$ designa a los elementos del primer grupo y $i=n+1,\ldots,n+m$ designa a los elementos del segundo grupo. Romper esa suma de plazas por grupo y re-expresar las dos piezas en términos de las desviaciones y los medios de los subconjuntos de los datos:
$$\eqalign{
(m+n)(\sigma^2_{1:m+n} + \mu_{1:m+n}^2) &= \sum_{i=1}^{1:n+m} x_i^2 \\
&= \sum_{i=1}^n x_i^2 + \sum_{i=n+1}^{n+m} x_i^2 \\
y= n(\sigma^2_{1:n} + \mu_{1:n}^2) + m(\sigma^2_{1+n:m+n} + \mu_{1+n:m+n}^2).
}$$
Algebraicamente la solución de este para $\sigma^2_{m+n}$ en términos de la otra (conocida) las cantidades de los rendimientos
$$\sigma^2_{1:m+n} = \frac{n(\sigma^2_{1:n} + \mu_{1:n}^2) + m(\sigma^2_{1+n:m+n} + \mu_{1+n:m+n}^2)}{m+n} - \mu^2_{1:m+n}.$$
Por supuesto, con el mismo enfoque, $\mu_{1:m+n} = (n\mu_{1:n} + m\mu_{1+n:m+n})/(m+n)$ puede ser expresada en términos de las medias de los grupos, también.
Un anónimo colaborador señala que cuando la muestra significa que son iguales (para que $\mu_{1:n}=\mu_{1+n:m+n}=\mu_{1:m+n}$), la solución para $\sigma^2_{m+n}$ es una media ponderada del grupo de la muestra desviaciones.