6 votos

Cómo interpretar el margen de error en una encuesta?

Recientemente los medios de comunicación informaron sobre un político electorales que se indicaba que "el 46% de los votantes Republicanos en Mississippi pensar que el matrimonio interracial debería ser ilegal". Un ejemplo de la historia (de muchos alrededor de la red) es este uno de los NY Daily News: el matrimonio Interracial debería ser ilegal, dicen que el 46% de Mississippi Republicanos en el nuevo sondeo. De ese artículo:

Una encuesta realizada el mes pasado muestra que el 46% de los votantes del partido REPUBLICANO en el estado creen que el matrimonio interracial debería ser ilegal - una pluralidad de las personas encuestadas

Dado que conozco a muchas personas que en los matrimonios interraciales (incluso en mi propia familia) me motivó a seguir la pista de la historia completa antes de caer a la obvia la histeria. He localizado el comunicado de prensa sobre la encuesta de Public Policy Polling aquí (PDF) que tiene:

El 46% de estos hardcore votantes Republicanos creen que el matrimonio interracial debería ser ilegal, mientras que el 40% cree que debería ser legal. Con Barbour incluye, Huckabee obtiene más apoyo (22%) de los antiguos que el último (15%), como lo hace Palin (13-6). El apoyo de Bachmann (10-2), Gingrich (13-8), y Pawlenty (4-1) funciona de la manera opuesta.

Y al final de la primera página en la que el estado:

PPP encuestó a 400 habitual Republicano de Mississippi, los votantes en las primarias de 24 de marzo al 27 de junio. La encuesta del margen de error es de +/-4.9%.

Ahora lo que no entiendo es cómo interpretar los resultados, especialmente el margen de error de valor.

A partir de los números en bruto, el 46% (~50%) de 400 votantes es de 200 votantes que respondieron que piensan que el matrimonio interracial debería ser ilegal. Pero a partir de estadísticas de Mississippi en el 2008 de la elección Federal, McCain encuestados alrededor de 725.000 votos Republicanos (a Obama de 556 000). Mi sensación es que no se puede extrapolar que el 46% número a otro 724,600 votantes Republicanos y todavía retener un 5% de margen de error.

También lo es el de los medios de tergiversar los números (¿de verdad? los medios de comunicación iba a hacer eso?!?!?!) O hay estadísticas en el trabajo que no entiendo?

Gracias por su ayuda!

9voto

jldugger Puntos 7490

La afirmación de que el margen de error es: $4.9$ % sigue desde suponiendo que la encuesta fue realizada como si de un cuadro se había llenado con los boletos, uno para cada miembro de la totalidad de la población (de "hardcore votantes Republicanos")--bien mezclado, $400$ de los que fueron ciegamente llevado a cabo, y cada uno de los asociados $400$ de los electores había escrito respuestas completas a todas las preguntas de la encuesta en sus entradas. Estos $400$ resultados de la encuesta son la "muestra".

El "como si" plantea un montón de preguntas prácticas que ir a si que la encuesta puede ser realmente visto como derivadas de tal manera. (¿Se puede realmente pensar de la población, como los representados por un conjunto definitivo de las entradas? Es justo asumir que todas las entradas son completamente lleno? Fue el muestreo llevado a cabo en una manera similar al dibujo de un fondo mixto de cuadro? Etc.) Otros encuestados han indicado algunas de esas preguntas. La concesión, sin embargo, que este es un modelo adecuado de la encuesta nos lleva al quid de la cuestión: ¿hasta qué punto estas $400$ entradas representan a toda la población? Nunca sabemos con certeza, pero podemos desarrollar algunas de las expectativas mediante el estudio de este proceso de muestreo de una caja de billetes.

Para ello, nos centramos en una pregunta a la vez. Podemos ver cada billete con el "sí" o "no" como respuesta para esa pregunta. Ahora comparamos los verdaderos resultados de la encuesta (es decir, las verdaderas proporciones de sí entre todos los boletos en la caja) a los resultados de la miríada de posibles muestras de $400$ entradas. (Hay más de $1.9 \times 10^{1475}$ este tipo de muestras.) Tenemos que hacer la comparación de los posibles verdadera proporción, pero aún así, es simplemente una cuestión de cálculo matemático. Este cálculo muestra que la respuesta observada en al menos $95$% de todas estas muestras se encuentra dentro de $\pm 4.9$% de la población de valor , no importa lo que la población de valor podría ser. Por ejemplo, si exactamente $50$% de las entradas en el cuadro son "sí", $95$ % de las posibles muestras de $400$ entradas contendrá entre $50-4.9$% = $45.1$% y $50+4.9$% = $54.9$ sí.

(Que calcula el valor de $95$% en realidad depende de la proporción verdadera de sí en la población: si la proporción es muy pequeña o muy grande, encontramos que un poco más de $95$% de todas las muestras dar resultados precisos dentro del margen de error. Una verdadera proporción de $50$% es el peor de los casos, que se usa porque no sabemos la proporción verdadera!)

Todo esto es el margen de error significa. Debido a $95$% es una fracción sustancial de todas las posibles muestras, sentimos que es muy probable que una muestra de que en realidad fue obtenida será entre estos $95$%. Un escéptico es permitido suponer que la muestra podría ser uno de los restantes $5$%: no podemos demostrar que estaba equivocado (basado únicamente en los resultados de la encuesta, de todos modos). Sin embargo, cálculos similares a mostrar (por ejemplo) que la proporción de sí difieren de los de la verdadera proporción por más de $12.2$% sólo en uno de cada millón de posibles muestras. Todavía es posible que la encuesta es entre estos uno-en-un-millón de muestras, pero tenemos muy inestable motivos para creer que. Por lo tanto, normalmente hay un límite a lo que constituye una "razonable" cantidad de dudas acerca de cuál es la verdadera proporción puede ser, y rara vez es tan extrema como la $\pm 100$%.

La visión fundamental de la proporcionada por estos cálculos es que una vez que el número de billetes en la caja se convierte moderadamente grandes (de unos pocos miles en este caso), el margen de error no depende de cuántos boletos están en el cuadro. Debe ser intuitivamente claro que la única cosa que realmente importa para una muestra relativamente pequeña es la proporción de sí en el cuadro, debido a que la proporción determina la probabilidad de extraer un "sí" o "no" y que la proporción no es apreciable el cambio entre el dibujo de la primera y el dibujo de la última de las $400$ entradas.

En resumen, suponiendo que es correcto a la vista de la encuesta como de actuar como dibujo entradas de un cuadro, de nuestro derecho a la "extrapolar" a partir de la encuesta a la población (un proceso más formalmente se conoce como inferencia estadística) es incierta, porque siempre se puede estar equivocado; pero cuando la muestra es sólo una pequeña fracción de la población, la cantidad por la que podríamos estar en un error en la toma de que la extrapolación depende principalmente del tamaño de la muestra, no es el tamaño de la población. Esta es la razón por la más creíble de las encuestas, ya sea de local o de ámbito internacional, el uso de muestras de unos pocos cientos a unos pocos miles. Es raro que muestras más grandes son necesarios para lograr una alta probabilidad de obtener una precisión razonable.

3voto

StasK Puntos 19497

No voy a tratar de entregar mi propia respuesta, pero me remito a la "¿Qué Es una Encuesta?" folleto recopilados por la Encuesta de Métodos de Investigación de la Sección de la Asociación Americana de Estadística. (Fritz Scheuren apoyándola en la página de título es un ex Presidente de ASA, desde hace unos cinco años. Él solía ser un alto perfil estadístico en agencias federales, tales como la Administración de la Seguridad Social y el Servicio de rentas Internas, y ahora semi-retirado por el gobierno para continuar trabajando como VICEPRESIDENTE de la National Opinion Research Center de la Universidad de Chicago.) El folleto ofrece una explicación clara y concisa de cuándo y por qué se puede o no se puede extrapolar los resultados de la encuesta a la población objetivo.

2voto

Pankaj Kumar Puntos 150

Para responder a su pregunta:

Esto es posible extrapolar a partir de una muestra de 400 a las opiniones de todos los 700.000. Este es contingente en la muestra aleatoria. El Poder estadístico es el tema que a usted le gustaría buscar en para confirmar esto. Si pido 400 de mis amigos más cercanos, esto no funciona. Para obtener una muestra realmente aleatoria, tendría que obtener la lista de todos los 700.000 personas, y el uso de un generador de números aleatorios para elegir 400 de ella. Aún así, no podrían ser algunos de los sesgos de selección. Por ejemplo, si sólo estamos llamadas a teléfonos fijos, luego los jóvenes (que a menudo sólo tienen teléfonos celulares) estaría bajo el representado en la muestra. Todavía es posible corregir estos problemas, pero tienes que ser bastante cuidadoso.

Nate Silverstein blog tiene unos muy buenos puestos en la fiabilidad de las diferentes encuestadoras, problemas con sus técnicas, y la correcta inferencia para Estados Unidos encuestas políticas.

0voto

Zizzencs Puntos 1358

La respuesta corta es sí, se puede extrapolar.

Respuesta larga: La pregunta clave es si los encuestadores tomó una muestra al azar de una población. Ellos afirman haber tomado una muestra aleatoria de los votantes de las primarias Republicanas. Pero esto es difícil. La gente se niega a contestar las encuestas, o que no son de la casa u otras cosas que pueden salir mal; peor aún, la gente que la respuesta no son una muestra aleatoria de toda la población (por ejemplo, los jóvenes tienen menos probabilidades de tierra de la línea de teléfonos celulares). La mayoría de los electores, por lo tanto intenta peso de la muestra de que lleguen a coincidir con una población conocida. Las encuestas de salida de las primarias Republicanas dar buenas estimaciones de diversos rasgos de esta población.

De buena reputación encuestadores (tales como PPP) trate de hacer esto de una manera equilibrada.

Así, se puede extrapolar a partir de una muestra relativamente pequeña a una gran población? Sí se puede, pero hay algunas advertencias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X