Estoy revisando la probabilidad y las estadísticas. Los libros de texto dicen que
si la población muestreada es infinita, entonces
ps
Tengo curiosidad acerca de cómo viene este resultado. Wikipedia no me dice mucho. Hay alguna mejora? ¿Cómo viene?
Estoy revisando la probabilidad y las estadísticas. Los libros de texto dicen que
si la población muestreada es infinita, entonces
ps
Tengo curiosidad acerca de cómo viene este resultado. Wikipedia no me dice mucho. Hay alguna mejora? ¿Cómo viene?
Si nuestra población consta de $N$ de los individuos y $x_i$, $i=1,\ldots,N$, es la variable de interés, entonces la población de la media y la varianza de la población está dada por $$ \bar{X}=\frac{1}{N}\sum_{i=1}^N x_i,\qquad \sigma^2=\frac{1}{N-1}\sum_{i=1}^N(\,x_i-\bar{X})^2. $$ Supongamos que una muestra aleatoria simple $x_1,\ldots,x_n$ del tamaño de la $n$ se extrae de esta población (es decir, cada muestra de tamaño $n$ tiene la misma probabilidad de ser dibujados). A continuación, la correspondiente media muestral y la varianza de la muestra es $$ \bar{x}=\frac{1}{n}\sum_{i=1}^n x_i,\qquad \mathrm{var}(\bar{x})=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2. $$ Se puede demostrar que $$ \mathrm{var}(\bar{x})=\frac{N-n}{Nn}\sigma^2=\left(1-\frac{n}{N}\right)\frac{\sigma^2}{n}. $$ Ahora, vamos a $N\to\infty$ y ver qué pasa.
Supongamos que tenemos un grupo de datos, para obtener la desviación estándar de la media, podemos calcular la media para muchos subgrupos de nuestros datos y el cálculo de la SD. Para ello, $\sigma_{\bar{y}}$ puede ser definido de la siguiente manera: $$\sigma_{\bar{y}}^2=\frac{\sum\limits_{j=1}^{k}(\bar{y_j}-y_{tm})^2}{k}$$ Donde $\bar{y_j}$ es la media de un número finito de datos, $y_{tm}$ es la media de un número infinito de datos, y k es el número de veces que tomó el número finito de datos. Desde $$\bar{y_j}=\frac{\sum\limits_{i=1}^{n}y_{i}}{n}$$ Sustituyendo a que en la primera ecuación obtenemos: $$\sigma_{\bar{y}}^2=\frac{1}{k}\sum\limits_{j=1}^{k}\left(\frac{1}{n}\sum\limits_{i=1}^{n}y_i-y_{tm}\right)^2$$ $$\sigma_{\bar{y}}^2=\frac{1}{kn^2}\sum\limits_{j=1}^{k}\left(\sum\limits_{i=1}^{n}y_i-ny_{tm}\right)^2$$ Pero $n=\sum_{i=1}^{n}1$, por lo que sustituyendo en la $n$ dentro del parentesis: $$\sigma_{\bar{y}}^2=\frac{1}{kn^2}\sum\limits_{j=1}^{k}\left(\sum\limits_{i=1}^{n}y_i-\sum\limits_{i=1}^{n}y_{tm}\right)^2=\frac{1}{kn^2}\sum\limits_{j=1}^{k}\sum\limits_{i=1}^{n}\left(y_i-y_{tm}\right)^2$$Since $\frac{1}{n}\sum_{i=1}^{n}(y_i-y_{tm})^2=\sigma_{j}^2$, porque es la varianza de cada grupo de datos: $$\sigma_{\bar{y}}^2=\frac{1}{nk}\sum\limits_{j=1}^{k}\sigma_{j}^2$$ Desde $\sigma_j^2$ es la varianza de un subgrupo de la misma fecha, se puede considerar el mismo para todos los $j$, y en la última, se obtiene: $$\sigma_{\bar{y}}^2=\frac{\sigma^2}{n}$$ $$\sigma_{\bar{y}}=\frac{\sigma^2}{\sqrt{n}}$$
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.