1 votos

teorema del límite central: ¿nos importa la desviación estándar dentro de una muestra de tamaño n?

Estoy aprendiendo aplicaciones sobre el Teorema Central del Límite y me he confundido con algunos puntos. Piensa en un ejemplo de aplicación del Teorema Central del Límite:

  1. Tenemos una población entera de 10 mil millones de elementos
  2. No es posible medir a toda la población, así que tomamos una muestra de ella. El tamaño de nuestra muestra es de 10000, lo que significa que seleccionamos al azar 10000 elementos de toda la población. Podemos calcular la media de la muestra, que es la media de estos 10000 elementos
  3. Repetimos el paso 2, digamos 8888 veces, y obtenemos 8888 muestras, cada una de las cuales tiene 10000 elementos seleccionados al azar; por lo tanto, también tenemos 8888 valores medios muestrales.

BIEN. Ahora hay 3 lugares donde podemos tomar las desviaciones estándar y estoy realmente confundido con su relación entre sí:

valor #1: la desviación estándar de toda la población, 10 mil millones de elementos.

valor #2: la desviación estándar dentro de una muestra, o la DS de 10000 elementos seleccionados al azar.

valor #3: la desviación estándar de 8888 medias muestrales.

Creo que cuando la gente habla de aplicar el Teorema del Límite Central y la ecuación de la "desviación estándar" y el "error estándar":

SE = SD / sqrt(n)

El SD se refiere al valor 1 y SE se refiere al valor #3, y n se refiere al tamaño de la muestra de 10000 en el ejemplo anterior.

Entonces, ¿el valor #2 es totalmente irrelevante en la historia? ¿Es algo que nunca debería importarnos?

1voto

Noah Puntos 85

Tienes razón al decir SD se refiere a SD #1 y SE se refiere a SD #3. La SD #2 entra en juego cuando no se conoce la SD #1. Podemos aproximar la DS #1 utilizando la DS #2. Esto es lo que motiva la prueba t y la distribución t. Sin embargo, cuando se habla del teorema del límite central, la DS #2 no es relevante.

1voto

ponsfonze Puntos 311

Lo primero que hay que tener en cuenta es que la media y el std-dev de una "población" es una constante universal, y no cambia. Cuando tomamos muestras, en realidad estamos tratando de "estimar" estas constantes, llamadas parámetros.

Volviendo a la interpretación de la CLT, cuando se toman muchas muestras, y luego se toma la media de esas muestras, se obtiene una distribución de las propias medias, y el desvío estándar de eso es a lo que se refiere el valor#3/SE. Esto se reduce mediante la fórmula que has proporcionado a medida que aumenta n (número de muestras).

Ahora, el valor#2 es sólo el std-dev de la "muestra" no la media, porque sólo tienes una/sola media para ese único conjunto de muestra.

Si todavía necesita aclaraciones, hágamelo saber en los comentarios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X