Respuesta de @user20160 es correcto. Realmente no tienes forma de saber el número de clusters que creará la combinación, porque no sabes cómo se solaparán esos clusters. Supongo que podría intentar estimarlo calculando la superposición de clusters de alguna manera antes de fusionar los conjuntos de datos, pero eso podría ser complicado dependiendo de la dimensionalidad de sus datos. También podría intentar responder a la pregunta "¿Cuántos clusters hay en este conjunto de datos?" utilizando un algoritmo de clustering diferente.
Los algoritmos de clustering basados en centroides, como k-means, no suelen ser la herramienta adecuada para esta tarea.* Si sus conjuntos de datos son grandes, podría considerar un algoritmo basado en la densidad, como DBSCAN o HDBSCAN. Si es bastante pequeño (<100), el clustering jerárquico podría ser todo lo que necesita.
Ambos tienen sus propios inconvenientes/nuances†, pero creo que ambos te serían más útiles para tratar de resolver este problema.
Supongo que si lo necesitas, podrías usar esos algoritmos para informar tu elección de un valor de $k$ para luego utilizarlo en k-means, pero no sé exactamente cuáles serían las implicaciones de eso, o cuán útil sería el resultado más allá de la salida del primer algoritmo.
*Si está puesto en k-means, supongo que podría analizar todos los valores posibles de <span class="math-container">$k [1, x]$</span> donde <span class="math-container">$x = \sum(k_i)$</span> para todos sus conjuntos de datos <span class="math-container">$i$</span> pero creo que se puede beneficiar de otros métodos.
†Los enfoques basados en la densidad suelen requerir el ajuste de los hiperparámetros, la agrupación jerárquica requiere que se elija una función de enlace y se establezca un punto de corte para podar el dendrograma