Ni la sugerencia en una Respuesta anterior (ahora eliminada) ni la sugerencia en el siguiente Comentario son correctas para la desviación estándar muestral de la muestra combinada.
Datos conocidos para referencia.: Primero, es útil tener datos reales a mano para verificar resultados, por lo que simulé muestras de tamaños $n_1 = 137$ y $n_2 = 112$ que son aproximadamente iguales a las de la pregunta.
Media de la muestra combinada: Dices que 'la media es fácil', así que veamos eso primero. La media muestral $\bar X_c$ de la muestra combinada puede expresarse en términos de las medias $\bar X_1$ y $\bar X_2$ de las primeras y segundas muestras, respectivamente, de la siguiente manera. Sea $n_c = n_1 + n_2$ el tamaño de la muestra combinada, y que la notación usando corchetes en subíndices denote los índices de las respectivas muestras.
$$ \bar X_c = \frac{\sum_{[c]} X_i}{n} = \frac{\sum_{[1]} X_i + \sum_{[2]} X_i}{n_1 + n_1} = \frac{n_1\bar X_1 + n_2\bar X_2}{n_1+n_2}.$$
Verifiquemos eso en R, usando mi conjunto de datos simulados (por ahora, ignoremos las desviaciones estándar):
set.seed(2025); n1 = 137; n2 = 112
x1 = rnorm(n1, 35, 45); x2 = rnorm(n2, 31, 11)
x = c(x1,x2) # conjunto de datos combinado
mean(x1); sd(x1)
[1] 31.19363 # media muestral de la muestra 1
[1] 44.96014
mean(x2); sd(x2)
[1] 31.57042 # media muestral de la muestra 2
[1] 10.47946
mean(x); sd(x)
[1] 31.36311 # media muestral de la muestra combinada
[1] 34.02507
(n1*mean(x1)+n2*mean(x2))/(n1+n2) # fórmula mostrada arriba
[1] 31.36311 # coincide con la media de la muestra combinada
Las fórmulas propuestas dan una desviación estándar combinada incorrecta: Aquí hay una demostración de que ninguna de las fórmulas propuestas encuentra $S_c = 34.025$ la muestra combinada:
Según la primera fórmula $S_a = \sqrt{S_1^2 + S_2^2} = 46.165 \ne 34.025.$ Una razón por la que esta fórmula es incorrecta es que no tiene en cuenta los diferentes tamaños de muestra $n_1$ y $n_2.$
Según la segunda fórmula tenemos $S_b = \sqrt{(n_1-1)S_1^2 + (n_2 -1)S_2^2} = 535.82 \ne 34.025.
Para ser justos, la fórmula $S_b^\prime= \sqrt{\frac{(n_1-1)S_1^2 + (n_2 -1)S_2^2}{n_1 + n_2 - 2}} = 34.093 \ne 34.029$ es más razonable. Esta es la fórmula para la 'desviación estándar combinada' en una prueba t de 2 muestras combinadas. Si tenemos dos muestras de poblaciones con medias diferentes, esta es una estimación razonable de la (desada) desviación estándar poblacional común $\sigma$ de las dos muestras. Sin embargo, no es una fórmula correcta para la desviación estándar $S_c$ de la muestra combinada.
sd.a = sqrt(sd(x1)^2 + sd(x2)^2); sd.a
[1] 46.16528
sd.b = sqrt((n1-1)*sd(x1)^2 + (n2-1)*sd(x2)^2); sd.b
[1] 535.8193
sd.b1 = sqrt(((n1-1)*sd(x1)^2 + (n2-1)*sd(x2)^2)/(n1+n2-2))
sd.b1
[1] 34.09336
Método para la desviación estándar combinada correcta: Es posible encontrar $S_c$ a partir de $n_1, n_2, \bar X_1, \bar X_2, S_1,$ y $S_2.$ Daré una indicación de cómo se puede hacer esto. Por ahora, veamos las varianzas muestrales para evitar las raíces cuadradas.
$$S_c^2 = \frac{\sum_{[c]}(X_i - \bar X_c)^2}{n_c - 1} = \frac{\sum_{[c]} X_i^2 - n\bar X_c^2}{n_c - 1}$$
Tenemos todo lo que necesitamos en el lado derecho excepto por $\sum_{[c]} X_i^2 = \sum_{[1]} X_i^2 + \sum_{[2]} X_i^2.$ Los dos términos en esta suma se pueden obtener para $i = 1,2$ a partir de $n_i, \bar X_i$ y $S_c^2$ resolviendo para $\sum_{[i]} X_i^2$ en una fórmula analógica a la última ecuación mostrada. [En el código a continuación abreviamos esta suma como $Q_c = \sum_{[c]} X_i^2 = Q_1 + Q_2.$]
Aunque algo complicado, este proceso de obtener varianzas muestrales combinadas (y por lo tanto desviaciones estándar combinadas) se utiliza en muchos programas estadísticos, especialmente cuando actualizando información de archivo con una muestra posterior.
Verificación numérica del método correcto: El código a continuación verifica que esta fórmula da como resultado $S_c = 34.02507,$ que es el resultado que obtuvimos anteriormente, directamente de la muestra combinada.
q1 = (n1-1)*var(x1) + n1*mean(x1)^2; q1
[1] 408219.2
q2 = (n2-1)*var(x2) + n2*mean(x2)^2; q1
[1] 123819.4
qc = q1 + q2
sc = sqrt( (qc - (n1+n2)*mean(x)^2)/(n1+n2-1) ); sc
[1] 34.02507