Dados dos conjuntos de datos $ U \in R$ y $P \in R$ . $n_1$ y $n_2$ son respectivamente el número de puntos contenidos en U y P. La suma de los errores al cuadrado de U y P son los siguientes:
$$ SSE_U=\sum_{i=1}^{n_1}||u_i-\bar u||^2 \\ SSE_P=\sum_{i=1}^{n_2} ||p_i-\bar p||^2$$
Ahora, dado un conjunto de datos $V=U \bigcup P$ la media de V es la siguiente: $$ \bar v = \frac{ n1*\bar u + n2 * \bar p}{n1 + n2} $$
Los puntos de U y P son únicos y los de V también. Por lo tanto, tenemos $n_3 = n_1 + n_2$ con $n_3$ el número de puntos contenidos en V.
Mi pregunta es cómo calcular el SSE del conjunto de datos V utilizando sólo el SSE y la media de los conjuntos de datos U y P.