2 votos

¿Cómo fusionar dos sumas de errores al cuadrado diferentes?

Dados dos conjuntos de datos $ U \in R$ y $P \in R$ . $n_1$ y $n_2$ son respectivamente el número de puntos contenidos en U y P. La suma de los errores al cuadrado de U y P son los siguientes:

$$ SSE_U=\sum_{i=1}^{n_1}||u_i-\bar u||^2 \\ SSE_P=\sum_{i=1}^{n_2} ||p_i-\bar p||^2$$

Ahora, dado un conjunto de datos $V=U \bigcup P$ la media de V es la siguiente: $$ \bar v = \frac{ n1*\bar u + n2 * \bar p}{n1 + n2} $$

Los puntos de U y P son únicos y los de V también. Por lo tanto, tenemos $n_3 = n_1 + n_2$ con $n_3$ el número de puntos contenidos en V.

Mi pregunta es cómo calcular el SSE del conjunto de datos V utilizando sólo el SSE y la media de los conjuntos de datos U y P.

1voto

Vitaly Zdanevich Puntos 95

Estamos tratando de encontrar la siguiente cantidad: $$\begin{align}S_v&=\underbrace{\sum_{i=1}^{n_1} ||u_i-\bar{v}||^2}_{S_{uv}}+\underbrace{\sum_{i=1}^{n_2}||p_i-\bar{v}||^2}_{S_{pv}}\end{align}$$ Centrémonos en el primer término: $$\begin{align}S_{uv}&=\sum_{i=1}^{n_1}||u_i-\bar{v}||^2=\sum_{i=1}^{n_1}||(u_i-\bar{u})+(\bar{u}-\bar{v})||^2\\&=\underbrace{\sum_{i=1}^{n_1}||u_i-\bar{u}||^2}_{S_u}+2\underbrace{\left(\sum_{i=1}^{n_1}(u_i-\bar{u})^T\right)}_{0}(\bar{u}-\bar{v})+n_1||\bar{u}-\bar{v}||^2\\&=S_u+n_1||\bar{u}-\bar{v}||^2\end{align}$$

Así, la cantidad total pasa a ser $$S_v=S_u+S_p+n_1||\bar{u}-\bar{v}||^2+n_2||\bar{p}-\bar{v}||^2$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X