2 votos

Explicación intuitiva de por qué el error estándar de las proporciones de la muestra no se divide por $n - 1$

Se discute mucho en este sitio por qué la suma de las desviaciones al cuadrado se divide por $n - 1$ al calcular la varianza o la desviación estándar de la muestra.

Una de las explicaciones que he oído al respecto es que "utilizamos" algunos de los datos para estimar la media de la población con la media de la muestra. Por lo tanto, eso costó 1 grado de libertad.

¿Puede alguien explicar, entonces, por qué, al calcular el error estándar de las proporciones de la muestra (como parte de la prueba z para 1 proporción poblacional) dividimos por $n$ y no $n - 1$ . El primer paso en ese proceso es calcular $\widehat{p}$ . Luego, el error estándar de las proporciones de la muestra se "construye" sobre la base de ese primer paso. Habría pensado que estimar la proporción poblacional con la proporción muestral nos habría costado 1 grado de libertad. Sé que cuando se cumplen los supuestos, las proporciones muestrales se distribuyen de forma normal (cuya forma no se rige por los grados de libertad), pero me queda la duda de por qué este cálculo (y francamente, el cálculo del error estándar de la media muestral) no es análogo al que hicimos para la desviación estándar muestral. ¿Por qué ambos errores estándar se calculan dividiendo por $n$ y no $n - 1$ ?

3voto

GenericTypeTea Puntos 27689

Cada observación en una prueba de diferencia de proporción tiene un valor 0 o 1. Se supone que estos valores son independientes entre sí (por ejemplo, la primera observación que registra un "1" no influye en si la segunda observación -o cualquier otra- también registrará o no un "1").

Estos dos hechos significan que la variable de resultado en una prueba de diferencia de proporción se distribuye Bernouli, con probabilidad $p$ . A diferencia de la distribución normal, en la que la media ( $\mu_{x}$ ), y la desviación estándar ( $\sigma_{x}$ ) son independientes entre sí; por ejemplo, los datos con distribución normal pueden tener una media de 5, pero una desviación estándar de 2, 20, 200.000 o cualquier (no negativo), y viceversa, en una distribución Bernouli la desviación estándar, y por lo tanto la desviación estándar de las proporciones de la muestra de tamaño $n$ es puramente una función de la media : $\sigma_{x} = \sqrt{p(1-p)}$ y $\sigma_{\widehat{p}} = \sqrt{\frac{p(1-p)}{n}}$ donde la media de los datos de Bernouli se "viste" con el símbolo ' $p$ '. Como ya se ha calculado la proporción, se obtiene la desviación estándar de la proporción de la muestra "gratis".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X