5 votos

Los tamaños de muestra para una población infinita

He clavado en algunas otras preguntas, y yo no estoy seguro de cómo lidiar con mi problema y mi conocimiento de la estadística se ha atrofiado. En particular que estoy tratando de elegir un tamaño de la muestra para una población que no sé el tamaño de (potencialmente infinito, pero podría ser de 10,000 o 100,000 o más). ¿Cómo elegir un tamaño de muestra que se me dé una respuesta significativa.

Es razonable que sólo enchufe en un número muy grande, y a ver qué sale, ¿enfoque de un límite?


Mi verdadero problema del mundo es esta:

Tengo dos sistemas informáticos (Able y Baker). Mi usuario de la comunidad cree que el Poder es más rápido que el Panadero. Puedo ejecutar una prueba simple en ambos, y ver cuánto tiempo se necesita para ejecutar una cada uno. Sin embargo, existen inconsistencias en la ejecución (probablemente a la red, que tendrá a los picos de actividad y yo por desgracia no puede quitarse de la prueba).

Baker estará funcionando durante años en el futuro, así que no tengo idea de cuántas transacciones se ejecute a lo largo de su vida.

Asumiendo que los problemas de rendimiento causados por la red son al azar, el número de pruebas que tengo que ejecutar cada uno en el Poder y que el Panadero a ser del 90% seguro de que es más rápido que el Panadero?

Tal vez me estoy haciendo la pregunta equivocada? Debo ser la búsqueda de la media de 100 pruebas en Poder y 100 pruebas en Baker y comparar? Puedo hacer que el número 100 con los más pequeños (a decir como 20)

23voto

goric Puntos 5230

1.) Un resultado sorprendente de que nos encontramos en una primera estadísticas supuesto es que la calidad de un típico estimación no depende (y mucho) en la el tamaño de la población, pero principalmente el tamaño de la muestra.

Por ejemplo, una muestra promedio basado en diez puntos de datos es igualmente exacto si el tamaño de la población es de 1000, 1000000, o el infinito.

Usted probablemente no tiene que preocuparse por el tamaño de la población.

2.) ¿Necesita 100 corridas de prueba para cada programa o 20 suficiente? Esto depende en parte de sus necesidades. Quiero decir, es importante saber si los dos equipos difieren en un promedio de un minuto, un segundo, una milésima de segundo? ¿Dónde pequeño las diferencias dejan de ser importantes para usted? Usted necesitar considerar esta pregunta primero debido a la desventaja entre "calidad de la prueba estadística" y "tamaño de muestra".

El tamaño de muestra requerido para su problema probablemente se verán algo como
$$n={2(1.645)^2 \sigma^2\over E^2}.$$

Vamos enchufe algún hecho números, sólo para tener una idea de lo que está pasando. Suponga que la desviación estándar de los tiempos de rendimiento es $\sigma = 1$ segunda. Y supongamos que queremos ser del 90% para detectar una diferencia promedio de 0.5 de un segundo. A continuación,$n=2(1.645)^2/(1/2)^2=21.64\approx 22$. Debemos tomar una muestra de alrededor de 22 pistas de cada máquina.

Por otro lado, si usted quería para detectar una diferencia promedio de 0.25 de un segundo, el tamaño de muestra va hasta por un factor de cuatro, que es, $n=86.59\approx 87$. El doble de la precisión, necesita cuatro veces como muchos de los puntos de muestreo.

Hormigón de información sobre la variabilidad inherente y en la precisión requerida se parte del cálculo del tamaño de muestra.

Más detalles sobre las pruebas estadísticas y cálculo del tamaño muestral se puede encontrar en la mayoría de introducción a las estadísticas, los libros de texto. Buena suerte!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X