Mientras hacía los deberes y comprobaba mis respuestas con las del libro me di cuenta de que a veces la desviación típica se divide por $\sqrt n$ donde $n$ es el tamaño de la muestra. Estoy un poco confuso. Para mi problema actual estoy tratando de encontrar el error estándar estimado del estimador. Había encontrado en una parte anterior del problema que $\hat \sigma=.33853$ y la muestra consta de $16$ medidas. Ahora el error típico es $.084633$ que es en realidad $\frac{\hat \sigma}{\sqrt{16}}$ . Cuando hallé la desviación típica no dividí por $4$ ¿Qué ha cambiado esta vez?
Respuestas
¿Demasiados anuncios?Esta fórmula puede derivarse de lo que sabemos sobre la varianza de una suma de variables aleatorias independientes[4].
Si $X_1, X_2 , \ldots, X_n$ son $n$ observaciones independientes de una población que tiene una media $\mu$ y desviación típica $\sigma$ entonces la varianza del total $T = (X_1 + X_2 + \cdots + X_n)$ es $n\sigma^2$ .
La varianza de $T/n$ debe ser $\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n}$ . Y la desviación típica de $T/n$ debe ser $\sigma/{\sqrt{n}}$ . Por supuesto, $T/n$ es la media muestral $\bar{x}$ .
Más explicaciones @ http://en.wikipedia.org/wiki/Standard_error
Las respuestas no mencionan un par de puntos clave. Así que sólo quería aclarar basado en mi entendimiento.
Esta fórmula se utiliza para calcular el desviación típica de una distribución muestral de la media (de un gran número de muestras de una población). En otras palabras, sólo es aplicable cuando se busca el desviación típica de las medias calculadas a partir de una muestra de tamaño $n$ tomado de una población.
Digamos que tomo una población y la muestro $10\,000$ veces con un tamaño de muestra de $n=2$ . Luego tomo la media de cada una de esas muestras (así que mis datos contienen $10\,000$ medias calculadas). Esta ecuación establece que con un número suficientemente grande de muestras, la desviación típica de las medias muestrales puede aproximarse utilizando esta fórmula:
$\frac{\sigma}{\sqrt{n}}$ o en este caso $\frac{\sigma}{\sqrt{2}}$
Debería ser intuitivo que a medida que $n \to p$ (tamaño de la población), la desviación típica de las medias muestrales será muy pequeña o, en otras palabras, las medias de cada muestra tendrán muy poca varianza (si cada muestra de $10\,000$ Si se tomara una muestra de toda la población, no se obtendría ninguna varianza con respecto a la media de la población).
Con ciertas condiciones de inferencia (nuestra muestra es aleatoria, normal, independiente) podemos utilizar este cálculo de la desviación típica para estimar la desviación típica de nuestra población. Dado que se trata sólo de una estimación, se denomina Error estándar . La condición para utilizarlo como estimación es que el tamaño de la muestra n sea superior a 30 (dado por el teorema del límite central) y cumpla la condición de independencia n <= 10% del tamaño de la población.
En la distribución normal, si la expectativa de la media de una muestra de tamaño n es la misma que la expectativa, sin embargo, la desviación típica de su muestra debe dividirse por la raíz cuadrada del tamaño de su muestra. Puedes leer sobre la Ley de la Raíz Cuadrada de n o el Teorema del Límite Central, que debería estar en algún lugar de tu libro de estadística.
He encontrado este documento que podría ser útil para algunos de ustedes: por qué dividimos por la raíz cuadrada de n
Proporciona tanto pruebas como intuiciones sobre la razón por la que existe una diferencia entre la desviación típica de un punto muestral y la media poblacional.