8 votos

Determinar el Tamaño de un Banco de Prueba

Supongamos que se tienen dos personas toman un examen que se compone de 30 preguntas, que son elegidos al azar de un banco de prueba de n preguntas.

La persona a y la Persona B, ambos toman diferentes generado aleatoriamente instancias del examen, y, a continuación, comparar los conjuntos de preguntas que fueron dados. La persona B avisos que 7 de sus 30 preguntas se repiten de Una Persona de la pregunta.

Es de todos modos hay que deducir el probable número total de preguntas en el banco de la prueba dado que usted sabe 7/30 de ellos se repite en una segunda instancia del examen? Obviamente, usted no obtener un valor exacto, pero podría determinar un rango de probabilidades para cada tamaño diferente de la prueba de banco? Cómo se podría ir sobre la resolución de este?

Gracias!

4voto

BruceET Puntos 7117

Esto puede ser resuelto por la "captura-recaptura' o 'marca-recaptura' los métodos de cálculo del tamaño de la población. Una persona es "capturar" y la otra es la 'reconquista'. El 'Chapman' estimador (ver Wikipedia sobre "marca-recaptura') en este caso es $\hat N_C = (30 + 1)(30 + 1)/(7 + 1) -1 \approx 119.$ Basado en un hipergeométrica modelo, este estimador es casi imparcial. La Wikipedia ofrece dos métodos para encontrar un correspondiente intervalo de confianza.

El mayor y más sencillo de 'Lincoln-Peterson' estimador es simplemente $\hat N = 30^2/7 \approx 128.$ da un valor infinito si sucede que hay no hay repetidas preguntas. Por lo tanto $E(\hat N)$ no existe, y uno no puede discutir la unbiassedness de este estimador.

Anexo: Los comentarios y la respuesta por @GregoryGrant está utilizando el Lincoln-Peterson estimador, que es el de máxima verosimilitud estimador basado en el conocimiento de que hay 7 coincidencias. Aquí hay algunos R pertinentes del código y una figura:

 N = 100:150
 like = choose(30,7)*choose(N-30, 30-7)/choose(N, 30)
 N[like==max(like)]  # value of N that maximizes 'like'
 ## 128
 plot(N, like, pch=20);  abline(v=128, lty="dotted")

enter image description here

Nota: Aquí es un método para obtener una solución analítica para el máximo: Vamos a $f(N|7) = {30 \choose 7}{N-30 \choose 23}/{N \choose 30}.$ A continuación, ver el $f(N|7)/f(N-1|7),$ simplificando con mucha de la cancelación. A continuación, observe el comportamiento de la relación.

4voto

Gregory Grant Puntos 6319

El número mínimo en la piscina debe ser $53$. Supongamos que hay $n$ en total.

Así que es como si tuvieras una urna con $n$ bolas, $30$ son blancos y $n-30$ son de color rojo. A continuación, tire de $30$ bolas al azar. Quieres saber cómo muchas de las pelotas que sacó son de color blanco. O más específicamente, de la que desea saber la probabilidad de que $7$ de la $30$ tire son de color blanco.

Deje $A$ el número de bolas blancas. A continuación, $P(A=k)$ es hipergeométrica y es igual a

$\frac{{{30}\choose{k}}{ {n-30}\choose{30-k}}}{{n}\choose{30}}$

Así que en tu caso:

$\frac{{{30}\choose{7}}{{n-30}\choose{23}}}{{n}\choose{30}}$

Esta es la probabilidad de que una superposición de exactamente $7$.

Usted ahora necesita encontrar la $n$ que maximiza la probabilidad de que.

Si usted comienza a conectar con los números (el uso de una calculadora) a partir de las $n=53$ probablemente vas a ver que va para arriba y, a continuación, pronto comienza a descender. Elija el max antes de que se comienza a ir hacia abajo. No debería ser mucho mayor que 53. Supongo que en algún lugar alrededor de 100.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X