12 votos

Es el número 20 de la magia?

Tengo referencias que aconseja considerar un tamaño de muestra de un mínimo de 20 para el ajuste de datos de distribución.

¿Tiene sentido esto?

gracias

13voto

Lantrix Puntos 134

Mucho de esto depende de la distribución esperada y cuál es su pregunta de investigación. Como regla general, usted debe ser cuidadoso de las reglas de pulgar. Si usted espera conocer la distribución, la ejecución de algunas simulaciones de diferentes tamaños y determinar la frecuencia con la muestra de simulaciones de reflejar la distribución real. Esto debería dar alguna guía como el final del tamaño de muestra requerido.

7voto

StasK Puntos 19497

Yo pensaba que el tamaño de la muestra número mágico es de 1.000. Eso es lo que la mayoría de las encuestas nacionales tienen, para producir el margen de error de alrededor de 3%: $$ z_{0.975}\sqrt{0.5\cdot0.5/1000} = 1.96 \cdot 0.158 = 0.031 $$ En realidad, el tamaño efectivo de la muestra son inferiores a 1,000, más como 700 o así, debido a la probabilidad desigual de selección y la falta de respuesta de los ajustes, que lleva a que el margen de error del 3,7%.

Con tan sólo 20 observaciones, que técnicamente no se puede llegar muy alto los valores de la asimetría y la curtosis (normalizado por la muestra desviaciones estándar, por supuesto): $$ |\mbox{asimetría}| \le \frac{n-2}{\sqrt{n-1}} = 4.58, |\mbox{curtosis}| \le \frac{n^2 - 3n + 3}{n-1} = 18.05. $$ Si el ajuste de una distribución por el método de los momentos, obviamente, no puede caber decir una distribución lognormal con una razonablemente típica varianza de los registros de igual a 1 (distribuciones de ingresos de moderada a alta desigualdad de ingresos de los países; estados unidos, Brasil, sudáfrica, Rusia tienen mayor varianza de registro de ingresos), ya que tiene un sorprendentemente gran curtosis de 111. Por supuesto, sería tonto para ajustarse a una distribución lognormal por el método de los momentos, pero yo sólo quería mostrar que el mundo real algunas distribuciones va a ser más complicado de lo que puede ser descrito con 20 observaciones.

Otro punto de vista sobre el ajuste de la distribución puede ser tomada a través de la estimación de densidad de kernel: para la muestra de tamaño $n=20$, el más popular de la regla que da el ancho de banda de $$ h=1.06 \hat\sigma n^{-1/5}=0.58\hat\sigma $$ lo que, efectivamente, abarca la totalidad de la distribución con el núcleo Gaussiano. En otras palabras, la mayoría de las muestras de tamaño 20 parecerá normal si ejecuta estimación de densidad de kernel a través de ellos, a menos que claramente tienen una notable curtosis (lo que significaría entonces que hay algunos periféricos de las observaciones que se muestran como independiente de las protuberancias en el kernel de densidad de la trama).

6voto

deejjaayy Puntos 101

Compruebe Russ Lenth Potencia y el Tamaño de la Muestra la Página para algunos artículos sobre el tema (en la sección del Consejo en el centro de la página).

El número mínimo de individuos en la muestra varía enormemente según el tamaño de la población, el número de dimensiones (si es dividir los datos en categorías) y las medidas (si está tomando medidas continuas acerca de la muestra indivifuals) que usted está tomando, el tamaño de su universo, la técnica de análisis que desee utilizar (este es un punto muy importante - técnica se define durante la planificación del estudio o durante el diseño experimental, nunca después), y la complejidad de la muestra por estudios anteriores.

Y 20, no es suficiente para que cualquier investigación seria, fuera de los temas de "enfermedades raras" y "psicología experimental" (psych como Popper define en su obra).

Refinación de la respuesta basada en los comentarios de abajo:

Y 20, no es suficiente para que cualquier investigación seria, fuera de los temas de "enfermedades raras" y "psicología experimental" (psych como Popper define en su obra) que consiste en el ajuste de una distribución de probabilidad.

Y no, no se debe mantener el envenenamiento de la gente para llegar a una muestra de gran tamaño. El Sentido común y Pruebas Secuenciales fin de que se detenga.

3voto

jws121295 Puntos 36

Nope. No de forma remota.

Piense en ello como esto: si usted tuviera un mil millones de dólares de espacio tridimensional (la humanidad) y el que sacó 20 muestras a cabo utilizando el método que sea (20 personas) podrían usar la información obtenida a entender razonablemente bien a cada persona en el planeta? No de forma remota. Hay 100 mil millones de estrellas en la galaxia de la vía Láctea. Por picking (al azar) de 20 de ellos se puede entender todo de astronomía galáctica? De ninguna manera.

1-d el espacio hay algunas heurísticas, en su mayoría válidas las reglas de pulgar que puede ayudar, que describen cómo muchas medidas que usted desea tomar. Se incluyen diferentes grados de utilidad y justificación, sino en cierto sentido, más bien defendido que "20". Ellos incluyen "5 mediciones por cada variable en el ajuste de la ecuación", "al menos 35 muestras de una función de densidad Gaussiana", y "al menos 300 muestras de un binomio de la función". Real estadísticos y no un nerd-bombardero como me va a ser capaz de asociar particular los intervalos de confianza y las incertidumbres de los primeros principios y sin una calculadora.

Si utiliza la regla de "5 mediciones por cada parámetro en el ajuste de la ecuación" y desea ajustar la densidad acumulativa de un 2 dimensiones curva de bi cúbicos de superficie en términos de la distribución de alturas que van a tener un sistema subyacente que es $ \int {\int {\frac {a_3{r^3}+a_2{r^2}+a_1r+a_0}{a_1r+a_0}}} dr $, una proporción de 5 de la orden de polinomio para un cúbicos. Tendrá 6+4=10 coeficientes. Si usted está tratando de adaptarse a su 10 valores de parámetro mediante 2 mediciones por cada parámetro, o mediante el uso de 20 mediciones, entonces usted va a estar violando esta heurística. Esta heurística se recomienda un mínimo de 10*5=50 mediciones.

Por favor, recuerde que "lo mejor" es una idea sin sentido, sin tener una "medida de la bondad". Cuál es el mejor camino? Si usted va a su perdición, tal vez una extremadamente larga y placentera. Si usted va a su propia coronación, tal vez un breve y magnífico. Si usted está caminando a través del desierto, una fresca sombra. ¿Cuál es la "mejor" número de muestras? Es tan increíblemente depende de su problema que no puede comenzar a ser respondidas con la autoridad antes de que. Todos ellos? Como muchos como usted puede? A aquellos que sólo darle un poco de sentido. Sí es como estar parcialmente muerto o está embarazada. Siendo parcialmente sin sentido es una consecuencia de un muy bajo definido por el problema.

Si usted está tratando de pronosticar con precisión el flujo de aire sobre un plano? Usted puede ser que necesite varios millones de mediciones de entrar en la bola del parque. Si quieres saber cómo altura, uno o dos podría hacer el trabajo.

Esto no se lleva hasta los puntos importantes de "que abarca el espacio" y "muestreo en lugares en los que se minimice la varianza en las estimaciones de los parámetros" pero la pregunta se sugirió un primer nivel de respuesta sería relevante. Estas cosas requieren conocer más acerca de la naturaleza del problema antes de que pueda ser implementado.

Nota: editado para mejorar por las sugerencias.

3voto

jasonmray Puntos 1303

Tal vez por el contexto donde se está llevando a cabo pruebas t o ANOVAR - una bastante común contexto en el basic de aplicaciones estadísticas - el tamaño de la muestra se necesita para cada grupo con el fin de ser capaz de tener mucha confianza en cada uno de los grupos significa que aproximadamente una distribución normal (de acuerdo con el teorema del límite central) cuando la distribución se puede asumir más o menos unimodal y no muy irregulares. Veinte y no de diecinueve o veinte-uno porque es un número redondo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X