Me gustaría calcular la desviación estándar para una muy grande (pero conocido) número de valores de la muestra, con la mayor precisión posible. El número de muestras es mayor que el que puede ser eficientemente almacenados en la memoria.
El básico de la fórmula de varianza es:
$\sigma^2 = \frac{1}{N}\sum (x - \mu)^2$
... pero esta formulación depende de conocer el valor de $\mu$ ya.
$\mu$ puede ser calculado de forma acumulativa, es decir, se puede calcular la media sin almacenar cada valor de ejemplo. Usted sólo tiene que guardar su suma.
Pero para calcular la varianza, es necesario almacenar cada valor de ejemplo? Dada una secuencia de muestras, puedo acumular un cálculo de la varianza, sin necesidad de una memoria de cada una de las muestras? Dicho de otra manera, hay una formulación de la varianza que no depende del conocimiento previo del valor exacto de $\mu$ antes de que todo el conjunto de la muestra se ha visto?