Estamos en la situación de la estimación de cierta cantidad de la población por cierta cantidad de la muestra. En este caso, estamos usando proporciones de muestra para estimar proporciones de la población, pero el principio es mucho más general.
Si se piensa en todas las observaciones en la muestra, tomando el valor de $1$ cuando tienen la característica de interés ("preferred naranjas con manzanas" en el ejemplo) y $0$ cuando no es así, entonces la proporción de $1$'s es la misma que la media del conjunto de la $0$ $1$ valores-así que usted puede ver fácilmente que una proporción de la muestra es en realidad un medio.
A medida que hacemos más y más muestras (utilizando el muestreo aleatorio), la muestra significa que tienden a converger a la media de población. (Esta es la ley de los grandes números).
Sin embargo lo que de verdad queremos tener una idea de lo lejos que podría ser (como podría ser representado por el ancho de un intervalo de confianza para la proporción, o por el margen de error, que normalmente es la mitad de un ancho).
Normalmente, el más datos tengas, menos incertidumbre que se tiene sobre alguna cantidad como un decir -- debido a que la desviación estándar de la distribución de la media muestral disminuye a medida que usted toma de muestras de mayor tamaño. [Imagine tomar muchas muestras diferentes de tamaño 4. La distribución de los medios es menos variable que la distribución de las observaciones originales-- la desviación estándar tienden a ser aproximadamente la mitad de grande. Ahora, si tomamos medio de muchas muestras diferentes de tamaño 400, la desviación estándar de la que debe ser mucho más pequeño de nuevo (sobre $\frac{_1}{^{20}}$th de la desviación estándar de las observaciones originales).
La desviación estándar de la distribución de la media muestral es una manera de medir la distancia típica de una media de la muestra es de la población, que está disminuyendo (disminuye cuando se $\frac{_1}{^n}$, como en los ejemplos anteriores).
Como resultado, estamos más seguros acerca de la precisión de nuestra estimación cuando la muestra es grande -- si nos repetimos el experimento de nuevo, otros medios sería cerca de la actual -- que agrupan a más y más fuerza, y porque (en este caso) nuestra estimación es imparcial, están agrupar juntos en torno a los valores que estamos tratando de estimar. Una sola media de la muestra se hace más y más información sobre donde la población podría ser.