Cuando veo las noticias me he dado cuenta que las encuestas de Gallup para cosas como presidencial elecciones han [I asumir al azar] muestra los tamaños de más de 1.000. De lo que recuerdo del Colegio estadísticas que era un tamaño de muestra de 30 una muestra "gran". Fue hecha para parecer que un tamaño de muestra más de 30 es inútil debido a los rendimientos decrecientes.
Respuestas
¿Demasiados anuncios?Wayne ha abordado el "30" cuestión bastante bien (mi propia regla de oro: la mención del número 30 en relación a las estadísticas, es probable que esté equivocado).
Por qué los números en las inmediaciones de 1000 a menudo son utilizados
Los números de alrededor de 1000-2000 se utilizan a menudo en las encuestas, incluso en el caso de una simple proporción ("¿Está a favor de $<$lo$>$?").
Esto se hace para que razonablemente precisas las estimaciones de la proporción se obtienen.
Si binomio de muestreo es de suponer, el error estándar de la proporción de la muestra es más grande cuando la proporción es de $\frac{1}{2}$ -, sino que el límite superior está siendo una muy buena aproximación para proporciones, aproximadamente entre el 25% y el 75%.
* "error estándar" = "la desviación estándar de la distribución de"
Un objetivo común es calcular los porcentajes para dentro de unos $\pm 3\%$ de la verdad porcentaje, alrededor de $95\%$ de la época. Que $3\%$ es llamado el 'margen de error'.
En que "el peor caso" error estándar bajo el binomio de muestreo, esto conduce a:
$1.96 \times \sqrt{\frac{1}{2}\cdot(1-\frac{1}{2})/n} \leq 0.03$
$0.98 \times \sqrt{1/n} \leq 0.03$
$\sqrt{n} \geq 0.98/0.03$
$n \geq 1067.11$
... o "un poco más de 1000'.
Así que si usted encuesta a 1000 personas al azar de la población desea hacer inferencias acerca de, y el 58% de la muestra de apoyo de la propuesta, puede estar razonablemente seguro de que la proporción de la población está entre el 55% y el 61%.
(A veces otros valores para el margen de error, tales como el 2,5% puede ser utilizado. Si usted reducir a la mitad el margen de error, el tamaño de la muestra va hasta por un múltiplo de 4.)
En encuestas complejas donde una estimación precisa de la proporción en algunos sub-población que se necesita (por ejemplo, la proporción de negro de los graduados de la universidad de Texas en favor de la propuesta), los números pueden ser lo suficientemente grandes como para que el subgrupo es de varios cientos de tamaño, tal vez conlleve a decenas de miles de respuestas en total.
Desde que rápidamente puede convertirse en algo poco práctico, es común dividir la población en subpoblaciones (estratos) y de la muestra de cada uno de ellos por separado. Aún así, usted puede terminar para arriba con algunas muy grandes encuestas.
Fue hace parecer que un tamaño de muestra de más de 30 es inútil debido a los rendimientos decrecientes.
Depende del tamaño del efecto, y en relación a la variabilidad. El $\sqrt$ n efecto sobre la varianza significa que usted puede ser que necesite algunos de ellos bastante grandes muestras en algunas situaciones.
Me contestó una pregunta aquí (creo que fue a partir de un ingeniero) que estaba tratando con muy grandes tamaños de muestra (en la vecindad de un millón si no recuerdo mal), pero él estaba buscando efectos muy pequeños.
Vamos a ver lo que una muestra aleatoria con un tamaño de muestra de 30 hojas con nosotros a la hora de estimar una proporción de la muestra.
Imaginar pedimos a 30 personas, si en general se aprobó el Estado de la Unión (muy de acuerdo, de acuerdo, en desacuerdo, totalmente en desacuerdo). Además imagino que el interés radica en la proporción que estar de acuerdo o fuertemente de acuerdo.
Dicen que 11 de los entrevistados de acuerdo y 5 muy de acuerdo, para un total de 16.
16/30 es de 53%. ¿Cuáles son nuestros límites para la proporción de la población (con decir que un 95% de intervalo)?
Podemos pin de la proporción de la población hacia abajo a aproximadamente entre el 35% y el 71% (aproximadamente), si nuestras suposiciones espera.
No del todo útil.
Que en particular la regla de pulgar sugiere que 30 puntos son suficientes para asumir que los datos están distribuidos normalmente (es decir, se parece a una curva en forma de campana), pero esto es, en el mejor, una guía aproximada. Si esto importa, compruebe sus datos! Esto sugiere que usted quiere al menos 30 de los entrevistados para la encuesta si su análisis depende de estos supuestos, pero hay otros factores también.
Uno de los principales factores es el "efecto tamaño". La mayoría de las razas tienden a ser bastante estrecha, lo bastante grande, se requieren muestras para detectar estas diferencias. (Si usted está interesado en la determinación de la "derecha" del tamaño de la muestra, usted debe mirar en el análisis de la potencia). Si tienes una variable aleatoria de Bernoulli (algo con dos resultados) que en aproximadamente 50:50, entonces usted necesita alrededor de 1000 ensayos para obtener el error estándar de un 1,5%. Eso es probablemente lo suficientemente preciso para predecir una carrera del resultado (los últimos 4 NOS Presidental elecciones tenían una media de margen de ~3.2 por ciento), que coincide con su observación muy bien.
La encuesta de datos es a menudo en rodajas y cubitos de diferentes maneras: "Es el candidato a la vanguardia con la pistola propietaria de los hombres mayores de 75 años?" o lo que sea. Esto requiere incluso de muestras de mayor tamaño, ya que cada encuestado encaja en sólo unas pocas de estas categorías.
Elecciones presidenciales son a veces "liado" con otras preguntas de la encuesta (por ejemplo, elecciones para el Congreso). Debido a que estos varían de estado a estado, uno de los extremos con un poco de "extra" los datos de las encuestas.
Bernoulli distribuciones discretas de probabilidad distribuciones con sólo dos resultados: la Opción 1 es elegido con una probabilidad de p$$, mientras que la opción 2 es elegido con una probabilidad de 1 $p$.
La varianza de una distribución de bernoulli es de $p(1-p)$, por lo que el error estándar de la media es de $\sqrt{\frac{p(1-p)}{n}}$. Enchufe en $p=0.5$ (la elección es un empate), establecer el error estándar a un 1.5% (0,015), y resolver. Usted necesitará obtener 1,111 los sujetos para llegar a 1.5% SE
"Al menos 30" la regla es abordado en otra publicación en la Cruz Validado. Es una regla de oro, en el mejor.
Cuando usted piensa en una muestra que se supone que representan a millones de personas, vas a tener que tener un mucho mayor muestra de sólo 30. Intuitivamente, 30 personas, incluso no se puede incluir a una persona de cada estado! Entonces creo que usted desea representar a los Republicanos, Demócratas e Independientes (al menos), y para cada uno de los que te quieren representar a un par de diferentes categorías de edad, y para cada una de esas un par de diferentes categorías de ingresos.
Con sólo 30 personas, llama, te vas a perder enormes extensiones de la demografía necesita de la muestra.
EDIT2: [he eliminado el párrafo que abaumann y StasK objetado. Todavía no estoy 100% convencido, pero especialmente StasK el argumento de que no puedo estar en desacuerdo con.] Si el 30 personas son verdaderamente seleccionado completamente al azar de entre todos los votantes elegibles, la muestra sería válida en algún sentido, pero demasiado pequeño para permitir que distinguir si la respuesta a su pregunta en realidad era verdadero o falso (entre todos los votantes elegibles). StasK explica lo malo que sería en su tercer comentario, más abajo.
EDIT: En respuesta a samplesize999 comentario, no es un método formal para determinar cómo de grande es lo suficientemente grande, llamado "análisis del poder", que también está descrito aquí. abaumann del comentario ilustra cómo existe un equilibrio entre su capacidad para distinguir las diferencias y la cantidad de datos que usted necesita para hacer una cierta cantidad de mejora. Como se ilustra, hay una raíz cuadrada en el cálculo, lo que significa que el beneficio (en términos de aumento de potencia) crece más y más lentamente, o el costo (en términos de la cantidad de muestras que usted necesita) crece cada vez más rápidamente, así que usted desea de muestras suficientes, pero no más.