Nunca sentí que entendía la controversia sobre la desviación estándar, hasta que encontré la desigualdad de Chebyshev.
Supongamos que tienes un montón de datos. Claramente, la media de los datos está en algún punto medio, y los datos están más o menos dispersos lejos de la media. La desviación estándar indica qué tan lejos están, en el siguiente sentido: no importa cómo estén distribuidos los datos, y no importa cuán dispersos estén, como máximo $1/n^2$ de ellos están a más de $n$ desviaciones estándar de la media.
Por ejemplo, si la desviación estándar es de 2 unidades, entonces todos menos un máximo de 1/9 de los datos están entre $m - 6$ y $m + 6$, donde $m$ es la media. A menudo los datos se agruparán más cerca de la media que esto, pero incluso si no sabes nada más, puedes garantizar que no más del 1/9 de los datos están a más de 6 unidades de $m$.
0 votos
¡No está del todo claro cuál es la pregunta! Por favor, háznoslo saber, ¿por medio de la combinatoria, qué tienes en mente?
0 votos
Simplemente dicho: la varianza es una "buena" medida de dispersión (que las respuestas a continuación han elaborado); desafortunadamente, dado que no tiene las mismas "dimensiones" que las medidas originales, resulta conveniente definir una nueva cantidad con dimensiones compatibles, y tomar la raíz cuadrada de la varianza (lo cual siempre se puede hacer ya que la varianza es siempre no negativa) es un primer paso obvio...
0 votos
También existe el teorema del límite central, que muestra que la esperanza y la varianza (o desviación estándar) son las características más relevantes de una distribución.
0 votos
Relacionado: ¿Motivación detrás de la desviación estándar?