La suma estándar de cuadrados, tal y como la conozco, es: $$ \sum(X-m)^2 $$ donde $m$ es la media. Me encontré con una diferente que se puede escribir de dos maneras: $$ \sum(X^2) - \frac{(\sum X)^2}{n} = \sum(X^2) - m\sum X $$ Creo que este último se llama "término de corrección de la media" (por ejemplo aquí ). Mi álgebra parece ser inadecuada para demostrar que son equivalentes, así que estaba buscando una derivación.
Respuestas
¿Demasiados anuncios?Ampliando el cuadrado obtenemos:
$\sum_i(X_i-m)^2 = \sum_i(X_i^2 + m^2 - 2 X_i m)$
Así,
$\sum_i(X_i-m)^2 = \sum_i{X_i^2} + \sum_i{m^2} - 2 \sum_i{X_i m}$
Desde $m$ es una constante, tenemos:
$\sum_i(X_i-m)^2 = \sum_i{X_i^2} + n m^2 - 2 m \sum_i{X_i}$
Pero,
$\sum_i{X_i} = n m$ .
Así,
$\sum_i(X_i-m)^2 = \sum_i{X_i^2} + n m^2 - 2 n m^2$
Lo que al simplificar nos lleva:
$\sum_i(X_i-m)^2 = \sum_i{X_i^2} - n m^2$
Así, obtenemos podemos reescribir el rhs de lo anterior de dos maneras:
$\sum_i{X_i^2} - m (n m) = \sum_i{X_i^2} - m \sum_i{X_i}$
(como $n m = \sum_i{X_i}$ )
et
$\sum_i{X_i^2} - n (m)^2 = \sum_i{X_i^2} - \frac{(\sum_i{X_i})^2}{n}$
(como $m = \frac{\sum_i{X_i}}{n}$ )
Aunque la fórmula es igual, la diferencia práctica es la facilidad de cálculo si lo haces a mano. Si todo lo que tuviera fuera un trozo de papel y un lápiz, preferiría la segunda fórmula $\sum X^2$ y $\sum X$ juntos requieren menos tiempo y son menos propensos a errores de cálculo que $\sum (X - m)^2$ .