Podemos ver esto de la siguiente manera:
Supongamos que estamos realizando un experimento en el que necesitamos lanzar una moneda imparcial $n$ veces. El resultado general del experimento es $Y$, que es la suma de los lanzamientos individuales (digamos, cara como 1 y cruz como 0). Entonces, para este experimento, $Y = \sum_{i=1}^n X_i$, donde $X_i$ son los resultados de los lanzamientos individuales.
Aquí, el resultado de cada lanzamiento, $X_i$, sigue una distribución de Bernoulli y el resultado general $Y$ sigue una distribución binomial.
El experimento completo se puede pensar como una sola muestra. Por lo tanto, si repetimos el experimento, podemos obtener otro valor de $Y$, que formará otra muestra. Todos los posibles valores de $Y$ constituirán la población completa.
Volviendo al lanzamiento de una sola moneda, que sigue una distribución de Bernoulli, la varianza se da por $pq$, donde $p$ es la probabilidad de cara (éxito) y $q = 1 - p.
Ahora, si miramos la varianza de $Y$, $V(Y) = V(\sum X_i) = \sum V(X_i)$. Pero, para todos los experimentos de Bernoulli individuales, $V(X_i) = pq$. Dado que hay $n$ lanzamientos o ensayos de Bernoulli en el experimento, $V(Y) = \sum V(X_i) = npq$. Esto implica que $Y$ tiene una varianza de $npq.
Ahora, la proporción de la muestra se da por $\hat p = \frac Y n$, lo que da la 'proporción de éxito o caras'. Aquí, $n$ es una constante, ya que planeamos tomar el mismo número de lanzamientos de moneda para todos los experimentos en la población.
Entonces, $V(\frac Y n) = (\frac {1}{n^2})V(Y) = (\frac {1}{n^2})(npq) = pq/n$.
Por lo tanto, el error estándar para $\hat p$ (una estadística de muestra) es $\sqrt{pq/n}$.
1 votos
Este artículo es muy útil para entender el error estándar de la media influentialpoints.com/Training/…
1 votos
De acuerdo a mi investigación en Google, parece que el tema relacionado de obtener intervalos de confianza para una distribución binomial es bastante matizado y complicado. En particular, parece que los intervalos de confianza obtenidos de esta fórmula, conocidos como "Intervalos de Wald" (ver es.wikipedia.org/wiki/Intervalo_de_confianza_para_la_proporci%C3%B3n), no se comportan de manera adecuada y deben evitarse. Consulta jstor.org/stable/2676784?seq=1#metadata_info_tab_contents para más información.