13 votos

¿Por qué se toma la raíz cuadrada para el recuento de muestras "N" en la fórmula de la desviación estándar?

Estoy tratando de entender un concepto muy básico de la desviación estándar.

A partir de la fórmula $\sigma= \sqrt{ \dfrac{ \sum\limits_{i=1}^n (x_i-\mu)^2} N } $

No puedo entender por qué debemos reducir a la mitad la población "N", es decir, por qué queremos tomar $\sqrt{N}$ cuando no hicimos ${N^2}$ ? ¿No es eso lo que sesga la población que estamos considerando?

La fórmula no debería ser $\sigma= \dfrac{ \sqrt{ \sum\limits_{i=1}^n (x_i-\mu)^2} } {N} $

14voto

AdamSane Puntos 1825

Usted está tratando de encontrar una "típica" de la desviación de la media.

La varianza es "el promedio del cuadrado de la distancia desde la media".

La desviación estándar es la raíz cuadrada de que.

Que hace la raíz cuadrada media de la desviación de la media.

  1. ¿Por qué utilizamos el promedio de la desviación cuadrática? Lo que hace que la varianza interesante? Entre otras cosas, porque de una hecho básico acerca de varianzas- que la varianza de una suma de correlación de las variables es la suma de las varianzas. (Esto está cubierto en un número de preguntas por ejemplo, aquí en CrossValidated. Esta práctica característica no es compartida, por ejemplo, por la media de la desviación absoluta.
  2. ¿Por qué tomar la raíz cuadrada de que? Porque entonces es en las mismas unidades que la original observaciones. Que las medidas de un tipo particular de 'distancia típica" de la media (como se ha mencionado, el RMS distancia) -, sino porque de la anterior propiedad de la varianza, que ha algunas características agradables.

9voto

Sean Hanley Puntos 2428

El desviación estándar es la raíz cuadrada del desviación .

La varianza es la distancia media al cuadrado de los datos respecto a la media. Como una media es la suma dividida por el número de elementos sumados, la fórmula de la varianza es:
$$ \text{Var}(X)=\text{E}[(X-\mu)^2] = \frac{\sum_{i=1}^N(x_i-\mu)^2}{N} $$ Como, de nuevo, la desviación estándar es simplemente la raíz cuadrada de esto, la fórmula de la desviación estándar es:
$$ \text{S.D.}(X)=\sqrt{\text{Var}(X)} = \sqrt{\frac{\sum_{i=1}^N(x_i-\mu)^2}{N}} $$ Aquí no se ha añadido ni cambiado nada sobre los supuestos o la varianza, simplemente hemos tomado la raíz cuadrada de la varianza, porque eso es lo que la desviación estándar es .

0 votos

Tal vez debería mencionarse que esta fórmula de la varianza sólo es válida para los uniformes discretos. de lo contrario, podría confundir la distinción entre la varianza de la muestra y la de la población

0 votos

@Taylor, no sé a qué te refieres. La fórmula de la varianza no está relacionada con la distribución.

0 votos

La fórmula de la varianza (muestral) no está relacionada con la distribución ( es.wikipedia.org/wiki/Valor_esperado#Definición )

2voto

victor_v Puntos 21

Lo primero que hay que entender es que la desviación estándar (std) es diferente de desviación media absoluta . Estos dos definen diferentes propiedades matemáticas sobre los datos.

A diferencia de la desviación media absoluta, la desviación estándar (std) pesa más a los valores que se alejan de la media, lo que se hace elevando al cuadrado los valores de diferencia.

Por ejemplo, para los siguientes cuatro puntos de datos: \begin{array}{|c|c|c|} \hline Data (x)& |x - mean| & (x-mean)^2 \\ \hline 2 & 2 & 4\\ \hline -2 &2 &4\\ \hline -6 &6 &36\\ \hline 6 &6 &36\\ \hline \sum x =0 & \sum (|x-mean|) = 16 & \sum (x-mean)^2 = 80 \end{array}

desviación media absoluta (aad) $= 16/4 = 4.0$ y

Desviación estándar (std) = $\sqrt{80/4} = \sqrt 20 = 4.47 $

En los datos, hay dos puntos que están a 6 distancias de la media, y dos puntos que están a 2 distancias de la media. Por lo tanto, la desviación de 4,47 tiene más sentido que 4.

Dado que la observación total es siempre $N$ para calcular la std no estamos buceando por $\sqrt N$ En cambio, dividimos la varianza total por $N$ y tomar su raíz cuadrada, para llevarla a la misma unidad que los datos originales.

1voto

jefferyear Puntos 23

Estoy de acuerdo en que su definición de desviación estándar $\sigma= \dfrac{ \sqrt{ \sum\limits_{i=1}^n (x_i-\mu)^2} } {N} $ podría utilizarse para medir la propagación de una población. Sin embargo, es un concepto más difícil de elaborar. (Y creo que también es más difícil de utilizar para, por ejemplo, demostrar otras teorías).

No conozco la historia exacta de la invención de la varianza y la desviación estándar, pero debe ser más o menos similar:

  1. Necesitamos un número positivo para medir la dispersión; definamos la varianza = $\dfrac{ \sum\limits_{i=1}^n (x_i-\mu)^2} N $

  2. Esta varianza parece mucho mayor que los valores originales debido al cuadrado; saquemos la raíz cuadrada para "deshacer" el efecto del cuadrado: $\sigma = \sqrt{\frac{\sum\limits_{i=1}^n (x_i-\mu)^2}{N}}$

Así que ahora tenemos una relación muy simple $std = \sqrt{variance}$ Por lo tanto $N$ está bajo la raíz cuadrada.

0voto

Amber Puntos 11

@Mahesh Subramaniya - Esto es sólo giro matemático . Cuando tenemos un valor original como $a/b = (-)d$ . Podemos obtener el mismo valor utilizando estas dos ecuaciones ${a}^2\diagup{b}=c$ y $\sqrt{c\diagup{b}}=d$ .

Por ejemplo, sólo hazlo con ${-5}\diagup{2}$ = $-2.5$ . Pero, queremos sólo valor no menos.

Ahora, ${-5}^2\diagup{2}=12.5$ . Y , $\sqrt{12.5\diagup{2}}=2.5$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X