Si he entendido bien tu pregunta, tienes que utilizar el Distribución hipergeométrica . Esta distribución suele asociarse a los modelos de urna, es decir, hay $n$ bolas en una urna, $y$ están pintados de rojo, y dibujas $m$ bolas de la urna. Entonces, si $X$ es el número de bolas en su muestra de $m$ que son de color rojo, $X$ tiene una distribución hipergeométrica.
Para su ejemplo concreto, dejemos que $n_A$ , $n_B$ y $n_C$ denotan las longitudes de sus tres listas y deja que $n_{AB}$ denotan el solapamiento entre $A$ y $B$ . Entonces
$$n_{AB} \sim \text{HG}(n_A, n_C, n_B)$$
Para calcular un valor p, puede utilizar este comando de R:
#Some example values
n_A = 100;n_B = 200; n_C = 500; n_A_B = 50
1-phyper(n_A_B, n_B, n_C-n_B, n_A)
[1] 0.008626697
Unas palabras de precaución. Recuerde las pruebas múltiples, es decir, si tiene muchas A y B entonces tendrá que ajustar sus valores p con una corrección. Para el ejemplo las correcciones FDR o Bonferroni.