La afirmación de que el margen de error es: $4.9$ % sigue desde suponiendo que la encuesta fue realizada como si de un cuadro se había llenado con los boletos, uno para cada miembro de la totalidad de la población (de "hardcore votantes Republicanos")--bien mezclado, $400$ de los que fueron ciegamente llevado a cabo, y cada uno de los asociados $400$ de los electores había escrito respuestas completas a todas las preguntas de la encuesta en sus entradas. Estos $400$ resultados de la encuesta son la "muestra".
El "como si" plantea un montón de preguntas prácticas que ir a si que la encuesta puede ser realmente visto como derivadas de tal manera. (¿Se puede realmente pensar de la población, como los representados por un conjunto definitivo de las entradas? Es justo asumir que todas las entradas son completamente lleno? Fue el muestreo llevado a cabo en una manera similar al dibujo de un fondo mixto de cuadro? Etc.) Otros encuestados han indicado algunas de esas preguntas. La concesión, sin embargo, que este es un modelo adecuado de la encuesta nos lleva al quid de la cuestión: ¿hasta qué punto estas $400$ entradas representan a toda la población? Nunca sabemos con certeza, pero podemos desarrollar algunas de las expectativas mediante el estudio de este proceso de muestreo de una caja de billetes.
Para ello, nos centramos en una pregunta a la vez. Podemos ver cada billete con el "sí" o "no" como respuesta para esa pregunta. Ahora comparamos los verdaderos resultados de la encuesta (es decir, las verdaderas proporciones de sí entre todos los boletos en la caja) a los resultados de la miríada de posibles muestras de $400$ entradas. (Hay más de $1.9 \times 10^{1475}$ este tipo de muestras.) Tenemos que hacer la comparación de los posibles verdadera proporción, pero aún así, es simplemente una cuestión de cálculo matemático. Este cálculo muestra que la respuesta observada en al menos $95$% de todas estas muestras se encuentra dentro de $\pm 4.9$% de la población de valor , no importa lo que la población de valor podría ser. Por ejemplo, si exactamente $50$% de las entradas en el cuadro son "sí", $95$ % de las posibles muestras de $400$ entradas contendrá entre $50-4.9$% = $45.1$% y $50+4.9$% = $54.9$ sí.
(Que calcula el valor de $95$% en realidad depende de la proporción verdadera de sí en la población: si la proporción es muy pequeña o muy grande, encontramos que un poco más de $95$% de todas las muestras dar resultados precisos dentro del margen de error. Una verdadera proporción de $50$% es el peor de los casos, que se usa porque no sabemos la proporción verdadera!)
Todo esto es el margen de error significa. Debido a $95$% es una fracción sustancial de todas las posibles muestras, sentimos que es muy probable que una muestra de que en realidad fue obtenida será entre estos $95$%. Un escéptico es permitido suponer que la muestra podría ser uno de los restantes $5$%: no podemos demostrar que estaba equivocado (basado únicamente en los resultados de la encuesta, de todos modos). Sin embargo, cálculos similares a mostrar (por ejemplo) que la proporción de sí difieren de los de la verdadera proporción por más de $12.2$% sólo en uno de cada millón de posibles muestras. Todavía es posible que la encuesta es entre estos uno-en-un-millón de muestras, pero tenemos muy inestable motivos para creer que. Por lo tanto, normalmente hay un límite a lo que constituye una "razonable" cantidad de dudas acerca de cuál es la verdadera proporción puede ser, y rara vez es tan extrema como la $\pm 100$%.
La visión fundamental de la proporcionada por estos cálculos es que una vez que el número de billetes en la caja se convierte moderadamente grandes (de unos pocos miles en este caso), el margen de error no depende de cuántos boletos están en el cuadro. Debe ser intuitivamente claro que la única cosa que realmente importa para una muestra relativamente pequeña es la proporción de sí en el cuadro, debido a que la proporción determina la probabilidad de extraer un "sí" o "no" y que la proporción no es apreciable el cambio entre el dibujo de la primera y el dibujo de la última de las $400$ entradas.
En resumen, suponiendo que es correcto a la vista de la encuesta como de actuar como dibujo entradas de un cuadro, de nuestro derecho a la "extrapolar" a partir de la encuesta a la población (un proceso más formalmente se conoce como inferencia estadística) es incierta, porque siempre se puede estar equivocado; pero cuando la muestra es sólo una pequeña fracción de la población, la cantidad por la que podríamos estar en un error en la toma de que la extrapolación depende principalmente del tamaño de la muestra, no es el tamaño de la población. Esta es la razón por la más creíble de las encuestas, ya sea de local o de ámbito internacional, el uso de muestras de unos pocos cientos a unos pocos miles. Es raro que muestras más grandes son necesarios para lograr una alta probabilidad de obtener una precisión razonable.