6 votos

¿Cuál es el propósito de la desviación estándar?

No tengo ningún conocimiento de estadística más allá del sentido común de la escuela secundaria. ¿Por qué la desviación estándar suele verse en los libros de combinatoria, y por qué se define deliberadamente la desviación estándar? ¿Cuál es su propósito?

Gracias de antemano. He consultado en Wikipedia y muchos otros sitios web para ver qué es esto, pero no son muy concisos y claros.

0 votos

¡No está del todo claro cuál es la pregunta! Por favor, háznoslo saber, ¿por medio de la combinatoria, qué tienes en mente?

0 votos

Simplemente dicho: la varianza es una "buena" medida de dispersión (que las respuestas a continuación han elaborado); desafortunadamente, dado que no tiene las mismas "dimensiones" que las medidas originales, resulta conveniente definir una nueva cantidad con dimensiones compatibles, y tomar la raíz cuadrada de la varianza (lo cual siempre se puede hacer ya que la varianza es siempre no negativa) es un primer paso obvio...

0 votos

También existe el teorema del límite central, que muestra que la esperanza y la varianza (o desviación estándar) son las características más relevantes de una distribución.

7voto

Michael Hardy Puntos 128804

El póster original hizo una pregunta adicional en un comentario:

"¿Por qué en el único propósito por el cual se está utilizando estás diciendo que no hay otra fórmula que podría reemplazarlo y compartir la misma popularidad que la desviación estándar?"

La desviación media absoluta también se puede utilizar como una medida de dispersión, pero carece de cierto tipo de comportamiento que hace que la desviación estándar sea superior a ella: Si tienes variables aleatorias independientes $X_1,\ldots,X_n$, entonces la desviación estándar de la suma $X_1+\cdots+X_n$ es la raíz cuadrada de la suma de los cuadrados de las desviaciones estándar de los términos individuales. No se conoce ninguna fórmula tan simple para la desviación media absoluta.

0 votos

Y, por supuesto, el cuadrado de las diferencias es continuamente diferenciable, mientras que la suma de las diferencias absolutas no lo es.

0 votos

Por lo general se diría "la varianza de la suma de las variables aleatorias es la suma de las varianzas de cada variable aleatoria", sin embargo. :P

6voto

MJD Puntos 37705

Nunca sentí que entendía la controversia sobre la desviación estándar, hasta que encontré la desigualdad de Chebyshev.

Supongamos que tienes un montón de datos. Claramente, la media de los datos está en algún punto medio, y los datos están más o menos dispersos lejos de la media. La desviación estándar indica qué tan lejos están, en el siguiente sentido: no importa cómo estén distribuidos los datos, y no importa cuán dispersos estén, como máximo $1/n^2$ de ellos están a más de $n$ desviaciones estándar de la media.

Por ejemplo, si la desviación estándar es de 2 unidades, entonces todos menos un máximo de 1/9 de los datos están entre $m - 6$ y $m + 6$, donde $m$ es la media. A menudo los datos se agruparán más cerca de la media que esto, pero incluso si no sabes nada más, puedes garantizar que no más del 1/9 de los datos están a más de 6 unidades de $m$.

0 votos

Esta es de hecho la razón detrás de palabras de moda como "seis sigma" siendo mencionadas constantemente...

6voto

will Puntos 6

La desviación estándar es una medida de cómo se encuentran ubicadas las observaciones en relación con la media. Por ejemplo, si tienes un conjunto de 2 observaciones: $$ 8 \ ,\ 2\ $$ Su media es $\bar{x}=\frac{8+2}{2}=5$. Pero como puedes ver, no están muy "cerca" de la media. Por otro lado, un conjunto de otras 2 observaciones como: $$ 4 \ , \ 6$$ tiene una media $\bar{x}=\frac{4+6}{2}=5$ también, pero esos valores están más cerca de la media. Por lo tanto, el primer conjunto tiene una desviación estándar grande (DE=3), mientras que el segundo conjunto tiene una más pequeña (DE=1). Estos dos números indican que cada observación está aproximadamente a 3 unidades de la media en el primer caso, mientras que las otras observaciones están a 1 unidad de la segunda media. Es muy importante en estadística conocer la diversidad y variabilidad de un conjunto de datos para poder analizarlos y llegar a conclusiones útiles sobre la población o la muestra que estás observando.

0 votos

¿Por qué estás diciendo que, con el único propósito para el que se está utilizando, no hay otra fórmula que pueda reemplazarlo y compartir la misma popularidad que la desviación estándar?

0 votos

No estoy muy seguro de lo que estás preguntando.. ¿Quieres saber la razón por la que usamos SD como medida de diversidad y no otra cosa?

0 votos

@Victor hay otras cantidades que podríamos calcular. La popularidad de la desviación estándar tiene más que ver con el hecho de que la varianza es más manejable que otras medidas de dispersión y que parece surgir con más frecuencia que otras medidas de dispersión, por ejemplo, la desviación estándar y la media son las cantidades relevantes en el teorema del límite central.

3voto

Robert Christie Puntos 7323

Dado una muestra $x = \{x_1,x_2,\ldots,x_n\}$ la desviación estándar de la muestra se define como $$ \operatorname{sd}(x) = \sqrt{\frac{1}{n} \sum_{k=1}^n(x_k - \bar{x})^2 } $$ donde $\bar{x} = \frac{1}{n} \sum_{k=1}^n$ denota la media de la muestra.

Varios propiedades de la desviación estándar son dignas de nota.

  • No cambia si todos los valores en la muestra se desplazan por la misma cantidad, $x_k \mapsto x_k + a$.
  • Si todos los valores en la muestra se multiplican por un factor común, es decir $x_k \mapsto \lambda x_k$, la variación estándar también se multiplica por su valor absoluto, es decir $\operatorname{sd}(\lambda \cdot x) \mapsto | \lambda | \cdot \operatorname{sd}( x)$.
  • La desviación estándar está acotada por arriba por la desviación máxima respecto de la media: $\operatorname{sd}(x) \leqslant \sup_k | x_k - \bar{x} |$. En particular la desviación estándar de una muestra con elementos idénticos es cero.

Debido a estas propiedades, la desviación estándar es una medida de la escala de los datos, que indica en qué medida los elementos de la muestra se desvían de la media, de ahí el nombre.

1 votos

Parece que estás asumiendo implícitamente (e innecesariamente) que $\lambda \geq 0$.

0 votos

@cardinal Gracias por el comentario, he actualizado la publicación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X