Considerar cada sección del examen como el que contiene el resultado de varios sorteos (sin reemplazo) de una urna. La urna que contiene el K
asignaturas que el estudiante ha estudiado, y el N - K
temas que él/ella se omiten. Deje J = N - K
, para una mayor comodidad.
La parte a contiene entre 0 y 4 asignaturas que el estudiante ha estudiado, mientras que la parte B contiene entre 0 y 2 temas.
Ahora, para cada uno de estos 15 combinaciones posibles, considerar el valor de k
que esa combinación da lugar a:
k = 0: 0 correct on part A, 0 correct on part B
k = 1: 0 correct on part A, 1 or 2 correct on part B, OR
1 correct on part A, 0 correct on part B
k = 2: 1 correct on part A, 1 or 2 correct on part B, OR
2 correct on part A, 0 correct on part B
k = 3: 2 correct on part A, 1 or 2 correct on part B, OR
3 correct on part A, 0 correct on part B, OR
4 correct on part A, 0 correct on part B
k = 4: 3 correct on part A, 1 or 2 correct on part B, OR
4 correct on part A, 1 or 2 correct on part B
En este punto, es sólo una cuestión de resumir las probabilidades de las configuraciones, para cada valor de k
. Deje f(k, K, J, n)
ser el pmf de la distribución hipergeométrica, k
bolas blancas extraídas, K
bolas blancas y J
bolas negras en la urna, y n
bolas extraídas en general. A continuación, las probabilidades son:
k = 0: f(0, K, J, 4) * f(0, K, J - 4, 2)
k = 1: f(0, K, J, 4) * (f(1, K, J - 4, 2) + f(2, K, J - 4, 2)) +
f(1, K, J, 4) * f(0, K - 1, J - 3, 2)
k = 2: f(1, K, J, 4) * (f(1, K - 1, J - 3, 2) + f(2, K - 1, J - 3, 2)) +
f(2, K, J, 4) * f(0, K - 2, J - 2, 2)
k = 3: f(2, K, J, 4) * (f(1, K - 2, J - 2, 2) + f(2, K - 2, J - 2, 2)) +
f(3, K, J, 4) * f(0, K - 3, J - 1, 2) +
f(4, K, J, 4) * f(0, K - 4, J, 2)
k = 4: f(3, K, J, 4) * (f(1, K - 3, J - 1, 2) + f(2, K - 3, J - 1, 2)) +
f(4, K, J, 4) * (f(1, K - 4, J, 2) + f(2, K - 4, J, 2))
Estoy asumiendo que la probabilidad es de sólo 0 donde la distribución no es compatible (por ejemplo, donde k > K
).
Como Joel W. dice en los comentarios, la probabilidad es difícil, y siempre vale la pena verificar su trabajo con una simulación. Aquí está mi código R para hacer eso (con N
a 25 y K
a 17; usted podría, por supuesto, establecer estas a todo lo que quería):
N <- 25
K <- 17
answered <- sapply(1:300000, function(i) {
subjects <- seq(from = 1, to = N)
studied <- sample(subjects, K)
asked <- sample(subjects, 6)
asked.1 <- asked[1:4]
asked.2 <- asked[5:6]
answerable.1 <- sum(is.element(asked.1, studied))
answerable.2 <- sum(is.element(asked.2, studied))
answered.1 <- min(answerable.1, 3)
answered.2 <- min(answerable.2, 1)
answered.1 + answered.2
})
table(answered) / length(answered)
En ejecución de lo anterior, tengo estas proporciones observadas:
k = 0: 0.00016
k = 1: 0.00910
k = 2: 0.09298
k = 3: 0.34898
k = 4: 0.54879
Mientras tanto, el uso de R para evaulate las probabilidades descritas anteriormente (con 25 y 17 sustituido por N y K), tengo:
k = 0: 0.00016
k = 1: 0.00896
k = 2: 0.09318
k = 3: 0.34762
k = 4: 0.55009
Bueno bastante de acuerdo, creo, para dar credibilidad a mi de la solución. Felizmente, las probabilidades suman 1, ignorando un poco de error de redondeo.)
Me doy cuenta de que una sola fórmula general habría sido más satisfactorio que el de tabulación enfoque basado en la tomé por encima. Por desgracia, yo no era capaz de llegar con un paño limpio, legible fórmula que encapsula todas las diversas sumas de dinero. Creo que la distinción entre el responsable y respondió a las preguntas realmente complica el problema, pero podría muy bien ser que alguien más experto en probabilidad y combinatoria podría encontrar una manera de expresar las diversas sumas de dinero como una sola crujiente fórmula.