7 votos

Error estándar de la distribución muestral de la media

He encontrado una ecuación que dice que el error estándar de la distribución muestral de la media es:

$$\sigma_{\bar{X}} = \sigma \cdot \sqrt{\frac{1}{n}-\frac{1}{N}}$$

Y cuando el tamaño de la población es muy grande, el factor de $1/N$ es aproximadamente igual a cero; y la desviación estándar de la fórmula se reduce a:

$$\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}$$

Sin embargo, yo no se cómo se encuentra la primera ecuación, puede alguien explicar?

He encontrado esta ecuación: http://stattrek.com/sampling/sampling-distribution.aspx

Me podría explicar la segunda ecuación en esa forma: \begin{equation} \begin{split} Var(\bar{X}) = Var\left(\frac{\sum_{i=1}^{n} X_i}{n}\right) \\ = \left(\frac{1}{n^2}\right)Var\left(\sum_{i=1}^{n} X_i\right) \\ = \left(\frac{1}{n^2}\right)\left(\sum_{i=1}^{n} Var(X_i)\right) \\ = \left(\frac{1}{n^2}\right)\left(\sum_{i=1}^{n}\sigma^2 \right) \\ = \left(\frac{1}{n^2}\right)\left(n\sigma^2\right) \\ = \frac{\sigma^2}{n} \end{split} \end{equation}

Sin embargo, yo no sé de donde apareció la primera ecuación.

5voto

jldugger Puntos 7490

La citada fórmula no es del todo correcta. Vamos a derivar la correcta.

Dado que la población media (o cualquier otra constante) puede ser sustraído de cada valor en una población $S$ sin cambiar la varianza de la población o de la muestra de la misma, se podría asumir que la población media es cero. Dejar los valores en la población de se $\{x_i\, \vert\, i\in S\}$, esto implica

$$0 = \sum_{i\in S} x_i.$$

El cuadrado ambos lados mantiene la igualdad, dando

$$0 = \sum_{i,j\in S}x_ix_j = \sum_{i\in S}x_i^2 + \sum_{i \ne j \in S} x_ix_j,$$

de dónde

$$\sum_{i\ne j \in S} x_ix_j = -\sum_{i\in S} x_i^2.$$

Este resultado clave será empleada más tarde.

Deje $S$ ha $N$ elementos. Debido a que su media es cero, su varianza es el promedio del cuadrado de valor:

$$s^2 = \frac{1}{N}\sum_{i\in S}x_i^2.$$

(Por favor, tenga en cuenta que no puede haber ninguna controversia sobre el denominador de $N$; en particular, definitivamente no es $N-1$: esta es una población de la varianza, no de un estimador.)

Para encontrar la varianza de la distribución muestral de la media, tener en cuenta todas las $n$-elemento de muestras. Cada uno corresponde a un $n$-subconjunto $A\subset S$ y tiene una media

$$\frac{1}{n}\sum_{i\in A} x_i.$$

Dado que la media de toda la muestra de medios es igual a la media de $S$, que es cero, la varianza de estos $\binom{N}{n}$ de la muestra significa que es el promedio de sus plazas:

$$s_n^2 = \frac{1}{\binom{N}{n}} \sum_{A\subset S}\left(\frac{1}{n}\sum_{i\in A}x_i\right)^2 = \frac{1}{n^2\binom{N}{n}} \sum_{A\subset S}\sum_{i,j\in A}x_ix_j \\= \frac{1}{n^2\binom{N}{n}} \sum_{A\subset S}\left(\sum_{i\in A}x_i^2 + \sum_{i\ne j\in A}x_ix_j\right) .$$

(Una vez más, $\binom{N}{n}$, no $\binom{N}{n}-1$, es la correcta denominador: esta es la varianza de una colección de $\binom{N}{n}$ números, no de un estimador de nada).

Revisión, por un momento, cualquier índice de $i$. El valor de $x_i$ aparecerá en $\binom{N-1}{n-1}$ de las muestras, debido a que cada muestra suplementos $x_i$ $n-1$ más de los elementos de $S$ $N-1$ resto de los elementos (el muestreo es sin reemplazo, recuerda). Su contribución a la mano derecha, por lo tanto es igual a $\binom{N-1}{n-1}x_i^2$.

También la fijación de un índice $j\ne i$, razonamiento similar muestra el producto $x_ix_j$ aparece en $\binom{N-2}{n-2}$ muestras, contribuyendo $\binom{N-1}{n-1}x_ix_j$ a la derecha. Por lo tanto, al sumar más de todos esos $i$$j$$S$,

$$s_n^2 = \frac{1}{n^2\binom{N}{n}} \left(\binom{N-1}{n-1}\sum_{i\in S}x_i^2 + \binom{N-2}{n-2}\sum_{i\ne j\in S}x_ix_j\right).$$

Enchufe el primer resultado en la última suma:

$$s_n^2 = \frac{1}{n^2\binom{N}{n}} \left(\binom{N-1}{n-1}\sum_{i\in S}x_i^2 + \binom{N-2}{n-2}\left(-\sum_{i\in S}x_i^2\right)\right).$$

Ahora es muy sencillo relacionar esta a la variación de $S$, debido a $\sum_{i\in S}x_i^2 = Ns^2$:

$$s_n^2 = \frac{1}{n^2\binom{N}{n}} \left(\binom{N-1}{n-1} - \binom{N-2}{n-2}\right)\left(Ns^2\right) = \frac{s^2}{n}\left(1 - \frac{n-1}{N-1}\right).$$

Por lo tanto la varianza muestral para el muestreo con replacment, $\frac{s^2}{n}$, se multiplica por $1 - \frac{n-1}{N-1}$ para obtener la varianza muestral para el muestreo sin reemplazo, $s_n^2$. En consecuencia, la multiplicación de ajuste para el muestreo de la desviación estándar es su raíz cuadrada, $\sqrt{1- \frac{n-1}{N-1}}$. Esto difiere de la citada fórmula, que utiliza $\sqrt{1 - \frac{n}{N}}$.


Dos comprobaciones simples nos puede dar un poco de consuelo con respecto a la corrección de este resultado. En primer lugar, la varianza de la muestra de medios de las muestras de tamaño $n=1$, $s_1^2$, obviamente es igual a la varianza de la población $s^2$. La fórmula correcta estados

$$s_1^2 = \frac{s^2}{1}\left(1 - \frac{1-1}{N-1}\right) = s^2,$$

como debería. Por desgracia, la citada fórmula afirma que $s_1^2 = s^2(\frac{1}{1} - \frac{1}{N})$, lo que, obviamente, no puede ser buena. Segundo, la varianza de la muestra de los medios de las muestras de tamaño $n=N$ es cero, porque no hay ninguna variación, y de hecho ambas fórmulas dar $0$ en este caso.

5voto

Jeff Bauer Puntos 236

Este resultado se relaciona específicamente para población finita (de tamaño $N$) y para el muestreo sin reemplazo (para el tamaño de la muestra $n$). Se hace más clara si escribimos

$$\sigma_{\bar{X}} = \sigma \sqrt{\frac{1}{n}-\frac{1}{N}} = \frac {\sigma}{\sqrt n}\left(\sqrt {1-\frac nN}\right) = \frac {\sigma}{\sqrt n}\left(\sqrt {\frac {N-n}N}\right)$$

Comparando el factor de corrección con la fórmula en el CV post se menciona en el comentario como un posible duplicado-creador de este uno, Explicación de factor de corrección finito, no aparece como $\left(\sqrt {\frac {N-n}{N-1}}\right)$. ¿Por qué esta diferencia en el denominador?

@chl respuesta no menciona

Usted notará que algunos autores utilizan $N$ en lugar de $N-1$ en el el denominador de la FPC; de hecho, depende de si usted trabaja con la muestra o de la población estadística: para la varianza, se $N$ en lugar de $N-1$ si usted está interesado en $S^2$ más que $\sigma^2$.

...que necesita ser reconciliado con @whuber la respuesta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X