4 votos

Cuando es la selección aleatoria sesgada (no son de fiar)?

Imagine que hay una población de 100 personas, de las cuales 3 son para ser seleccionados al azar de cada día para la prueba de alcohol.

Después de un mes de selecciones (después de las 20 selecciones), ¿cuántas veces alguien debe ser seleccionado antes de que me necesita preocuparse acerca de la aleatoriedad en el proceso?

Datos reales: tengo dos personas seleccionadas 3 veces cada uno; siete personas seleccionadas 2 veces, y un montón de ellos seleccionado 1 tiempo (y otro montón nunca seleccionado) en el mes anterior.

Si la misma persona se selecciona, todos los días durante 20 días, sin duda (sobre 99.9999999999%) es algo malo.

¿Cuál es la probabilidad de que hay algo cuando una persona es seleccionada 5 veces? Lo que se ha seleccionado 4 veces? 3 veces? ¿Qué pasa si dos personas se seleccionó a 4 veces cada uno de ellos? ...

Cuando debo empezar a pensar en hacer ponderado de las selecciones?

¿Cómo ir sobre la fabricación de este tipo de cálculos?

8voto

JMoravitz Puntos 14532

Dado veinte fechas de las pruebas en un mes, de 100 personas de la población, y tres personas elegidas sin sustitución para cada fecha de prueba:

De una persona individual perspectiva, es $1-\frac{\binom{99}{3}}{\binom{100}{3}}= 0.03$ de probabilidad de ser seleccionado. La posibilidad de que él es seleccionado exactamente $k$ veces $20$ ensayos serían $\binom{20}{k}0.03^k0.97^{20-k}$

Esto da lugar a la siguiente tabla de probabilidades

$\begin{array}{|c|c|}\hline\text{picked exactly}~k~\text{times}&\text{probability}\\ \hline 0& \approx 0.5437\\ \hline 1& \approx 0.3364\\ \hline 2& \approx 0.0988\\ \hline 3& \approx 0.0183\\ \hline 4& \approx 0.0024\\ \hline 5& \approx 0.00024\\ \hline 6& \approx 0.000018\\ \hline \vdots\\ \hline\end{array}$

Tratar a cada persona como una variable de bernoulli vemos, entonces, que debemos esperar en $100$ de las personas que durante un mes no debe estar alrededor de $54$ de la gente nunca probado, alrededor de $33$ personas probado una vez, alrededor de $9$ personas probado dos veces, alrededor de $2$ personas probado tres veces, y tal vez una o dos personas que probado más veces de las que.

Por supuesto, que no se detiene a alguien de haber sido puesto a prueba seis o más veces, sólo que es un escenario poco probable.

Para cada una de estas, la desviación estándar se calcula como:$\sqrt{np(1-p)}$, y debemos esperar que la mayoría de las veces se encuentran dentro de dos desviaciones estándar de la media.

$\begin{array}{|c|c|}\hline\text{picked exactly}~k~\text{times}&\text{expected range of number of people}\\ \hline 0& 49 - 59\\ \hline 1& 29-38\\ \hline 2& 7-13\\ \hline 3& 0-3\\ \hline 4& 0-1\\ \hline 5& 0-1\\ \hline 6& 0-1\\ \hline \vdots\\ \hline\end{array}$

Para responder a tu pregunta, si los datos que cae fuera de los rangos por encima de un considerable margen, tal vez comience a preocuparse, pero hay que tener en cuenta que dentro de dos desviaciones estándar que se espera que ocurra sólo en torno a $95\%$ del tiempo. Habrá ocasiones en las que se encuentra fuera de ese rango.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X