Añadido: Henry y mis respuestas, mientras que los enfoques son diferentes, en realidad dan el mismo resultado! Para ver por qué, vamos a hacer el caso general con $N$ bases de datos, $M$ de los cuales contienen la palabra clave, y nosotros la elección de $K$ bases de datos. Deje $X$ ser el número de la $K$ bases de datos elegido que contienen la palabra clave. Para $P(X = x)$, Henry y mi lógica se dan las siguientes respuestas.
$$\text{ Henry: } P(X = x) = \frac{\binom{M}{x}\binom{N-M}{K-x}}{\binom{N}{K}}; \text{ me: } P(X = x) = \frac{\binom{K}{x} \binom{N-K}{M-x}}{\binom{N}{M}}.$$
Pero
$$\frac{\binom{M}{x}\binom{N-M}{K-x}}{\binom{N}{K}} = \frac{M!}{x! (M-x)!} \frac{(N-M)!}{(K-x)! (N-M-K+x)!} \frac{K! (N-K)!}{N!}$$
$$= \frac{K!}{x! (K-x)!} \frac{(N-K)!}{(M-x)! (N-K-M+x)!} \frac{M! (N-M)!}{N!} = \frac{\binom{K}{x} \binom{N-K}{M-x}}{\binom{N}{M}}.$$
Por lo tanto, las respuestas que dan el mismo resultado.
(Respuesta Original.)
Me gustaría enfocarlo de forma diferente. Deje $X$ el número de los primeros cuatro bases de datos en la que se encuentra la palabra clave. Desea $P(X \geq 2)$.
$$P(X = 2) = \frac{\binom{4}{2} \binom{5}{3}}{\binom{9}{5}}$$ because there are $\binom{4}{2}$ ways that 2 of the first 4 databases can contain the keyword, $\binom{5}{3}$ ways that 3 of the last 5 databases can contain the keyword, and $\binom{9}{5}$ maneras que 5 de los 9 total de las bases de datos que contienen la palabra clave.
Voy a dejar de calcular el $P(X = 3)$ e $P(X = 4)$.
(FYI, $X$ tiene lo que se llama una distribución hipergeométrica.)