Estoy aprendiendo aplicaciones sobre el Teorema Central del Límite y me he confundido con algunos puntos. Piensa en un ejemplo de aplicación del Teorema Central del Límite:
- Tenemos una población entera de 10 mil millones de elementos
- No es posible medir a toda la población, así que tomamos una muestra de ella. El tamaño de nuestra muestra es de 10000, lo que significa que seleccionamos al azar 10000 elementos de toda la población. Podemos calcular la media de la muestra, que es la media de estos 10000 elementos
- Repetimos el paso 2, digamos 8888 veces, y obtenemos 8888 muestras, cada una de las cuales tiene 10000 elementos seleccionados al azar; por lo tanto, también tenemos 8888 valores medios muestrales.
BIEN. Ahora hay 3 lugares donde podemos tomar las desviaciones estándar y estoy realmente confundido con su relación entre sí:
valor #1: la desviación estándar de toda la población, 10 mil millones de elementos.
valor #2: la desviación estándar dentro de una muestra, o la DS de 10000 elementos seleccionados al azar.
valor #3: la desviación estándar de 8888 medias muestrales.
Creo que cuando la gente habla de aplicar el Teorema del Límite Central y la ecuación de la "desviación estándar" y el "error estándar":
SE = SD / sqrt(n)
El SD
se refiere al valor 1 y SE
se refiere al valor #3, y n
se refiere al tamaño de la muestra de 10000
en el ejemplo anterior.
Entonces, ¿el valor #2 es totalmente irrelevante en la historia? ¿Es algo que nunca debería importarnos?